
瑞士初创公司LogicStar决心加入AI代理游戏。这家成立于2024年夏季的初创公司已获得300万美元的种子轮融资,旨在为开发者市场提供工具,实现软件应用的自主维护,而不是更典型的AI代理用例——代码共同开发。
LogicStar首席执行官兼联合创始人鲍里斯·帕斯卡列夫(Boris Paskalev)建议,该初创公司的AI代理最终可能会与代码开发代理合作,例如Cognition Labs的Devin等,实现商业共赢。
代码诚实度对于构建和部署软件的AI代理来说是一个问题,就像对于人类开发人员一样,而LogicStar希望通过自动捕捉和修复部署代码中出现的错误,为开发轮廓增加一把润滑剂。
帕斯卡列夫表示,到目前为止,“即使是最好的模型和代理”也无法解决它们所面临的大部分错误——因此团队看到了一家致力于改善这些概率并实现更少乏味应用程序维护梦想的AI初创公司的机会。
为此,他们正在在大型语言模型(LLM)的基础上构建——例如OpenAI的GPT甚至中国的DeepSeek——采用一个不受特定模型约束的方法来构建他们的平台。这使LogicStar能够利用不同的LLM,并根据哪种基础模型最适合解决特定的代码问题,最大化其AI代理的效用。
帕斯卡列夫声称,创始团队具有构建可以解决甚至挑战或使LLM独立工作的编程问题的平台的技术和领域特定知识。他们还可以指引过去的创业成功:他在2020年9月将他的先前的代码审查初创公司DeepCode卖给网络安全巨头Snyk。
“起初,我们想实际构建一个用于代码的大型语言模型”,他告诉TechCrunch。“然后我们意识到,那很快会成为商品… 现在我们假定所有这些大型语言模型都在那里。假定确实存在一些相当不错的[Ai]代码代理,我们如何从中提取最大的商业价值?”
他说,这个想法建立在团队对软件应用程序分析如何进行的理解之上。“结合大型语言模型,然后专注于对大型语言模型和AI代理实际建议的基础进行验证。”
测试驱动开发
然后,对于每个提出的错误,AI代理能够确定应用程序的哪些部分受到影响——这使LogicStar能够缩小需要模拟的函数范围,以便测试成百上千种潜在的修复方案。
帕斯卡列夫表示,由于LogicStar的平台实现了这种“最小化执行环境”,其AI代理能够运行“成千上万”的测试,以复制错误以识别“失败测试”,通过这种“测试驱动开发”方法,最终达成一个稳固效果。
他确认,实际的错误修复来源于LLM。但是因为LogicStar的平台实现了这种“非常快速的执行环境”,其AI代理可以按规模分辨好坏,为用户提供LLM能够提供的最佳捷径。
“我们看到[LLMs]对于原型设计,测试等非常出色,但对于[代码]生产,商业应用来说绝对不是很好。我认为我们离这个目标还很远,这就是我们的平台所提供的内容,他说。 “为了能够提取这些模型的能力,我们今天可以安全地提取商业价值,并节省开发人员的时间,使他们真正专注于重要的事情。”
企业将是LogicStar的最初目标。其“硅代理”旨在与公司开发团队并肩工作,尽管所需的薪水仅是雇用人类开发人员的一小部分,处理一系列应用程序维护任务,并释放工程人才进行更具创造性和/或挑战性的工作。(或者说,至少在LLMs和AI代理变得更加强大之前。)
尽管这家初创公司的推介标榜“完全自主”应用程序维护功能,帕斯卡列夫确认,该平台将允许人类开发人员审查(以及其他监督)其AI代理调用的修复方法。因此,必须先赢得信任。
“人类开发人员提供的准确性范围在80%到90%之间。我们AI代理的目标是确切地达到那里,”他补充说。
对于LogicStar来说,现在还处于早期阶段:其技术的阿尔法版本正在与一些未披露的公司进行测试,帕斯卡列夫称他们为“设计合作伙伴”。目前该技术仅支持Python,但据称将很快扩展至Typescript、Javascript和Java。
“[种子融资的]主要目标是实际向我们的设计合作伙伴展示技术的价值——专注于Python,”帕斯卡列夫补充说,“我们已经花了一年的时间,我们有很多机会扩展。这就是为什么我们首先尝试集中于一个案例来展示价值。”
这家初创公司的种子融资由欧洲风险投资公司Northzone领投,还有来自DeepMind、Fleet、Sequoia scouts、Snyk和Spotify的天使投资者加入了这一轮融资。
Northzone合伙人米歇尔·科廷(Michiel Kotting)在一份声明中表示:“基于AI的代码生成仍处于早期阶段,但我们已经看到的生产力收益是革命性的。这项技术提升开发流程、降低成本并加速创新的潜力是巨大的。团队极丰富的技术专长和经过验证的记录使他们有望提供真正影响深远的成果。软件开发的未来正在重塑,LogicStar将在软件维护中发挥关键作用。
LogicStar正在为希望表达对获得早期访问感兴趣的潜在客户建立等候名单。该公司告诉我们,计划在今年晚些时候推出Beta版。