本周人工智能动向:OpenAI与出版商的便利合作

\n

跟上人工智能这个飞速发展的行业实在是一项艰巨的任务。所以在有一天人工智能能够替你完成这项任务之前,这里有一些最近关于机器学习领域的新闻以及我们没有单独报道过的重要研究和实验。

\n

顺便说一句,TechCrunch计划很快推出一个人工智能新闻简报。敬请期待。与此同时,我们将频率提升至每周一次的AI专栏,之前是每月两次(或者更少),所以请多留意我们的新文章。

\n

本周,在人工智能领域,OpenAI宣布与新闻集团News Corp达成协议,对News Corp旗下品牌(如《华尔街日报》、《金融时报》和《MarketWatch》)的文章进行OpenAI开发的生成式人工智能模型的训练。双方描述这项协议为“多年”和“历史性”,同时OpenAI也获得了在应用程序中展示News Corp的标志的权利,比如在回答某些问题时可能部分或完全来源于News Corp出版物。

\n

听起来对双方都是一场胜利,对吧?News Corp获得了资金的注入,据报道超过2.5亿美元,这对于媒体行业前景比平常更为渺茫的现在来说是一个好消息。(生成式人工智能并没有帮助到媒体行业,威胁到大大降低出版物的引用流量。)与此同时,OpenAI正与一系列版权持有者在公平使用争端上作斗争,至少少了一场昂贵的法庭纠纷要担心。

\n

但细节在于协议的截止日期。需要注意的是,News Corp的协议以及OpenAI的所有内容许可协议都有一个截止日期。这本身并非OpenAI恶意的行为。由于各方的动机是为了保持未来重新谈判的可能性,在媒体行业,永久授权是少见的。但是,考虑到OpenAI首席执行官Sam Altman最近关于人工智能模型训练数据重要性日益减少的言论,这有点可疑。

\n

在“全力以赴”播客节目中,Altman表示,“我肯定认为训练数据的竞赛将不会存在”,因为“当模型足够聪明时,在某些阶段,不应该再依赖更多的数据——至少对于训练来说不再需要。” 在其他地方,他告诉MIT Technology Review的詹姆斯·奥唐纳说,他“乐观地认为”OpenAI——或者更广泛的人工智能行业——将会“找到一种摆脱(需要)更多和更多训练数据”的方法。

\n

目前模型还不够“聪明”,导致OpenAI据报道正在尝试使用合成训练数据并在网络的远端地区以及YouTube上寻找有机来源。但让我们假设有一天他们不需要太多额外数据就能实现质的飞跃。那对出版商意味着什么,特别是一旦OpenAI刮取了他们的整个档案资料?

\n

我想说的是,出版商——以及OpenAI合作的其他内容所有者——似乎只是短期便利的合作伙伴,不会更多。通过许可协议,OpenAI有效地中和了一种法律威胁——至少在法庭确定在人工智能训练背景下如何适用合理使用时——并宣布了一场公关胜利。出版商获得了急需的资本。但可能严重危害这些出版商的人工智能研究继续进行。

\n

以下是本周其他一些值得关注的人工智能故事:

\n
  • Spotify的AI DJ:Spotify推出了AI DJ功能,为用户提供个性化的歌曲选择,这是公司迈向人工智能未来的第一步。现在,Spotify正在开发一个该DJ的替代版本,将会说西班牙语,Sarah写到。
  • \n\n\n\n
  • Meta的AI咨询委员会:Meta周三宣布成立一个AI咨询委员会。但存在一个大问题:其中只有白人男性。考虑到边缘化群体最有可能遭受人工智能技术缺陷的后果,这显得有点不够敏感。
  • \n\n\n\n
  • FCC提议AI披露:美国联邦通信委员会(FCC)提出要求政治广告中披露人工智能生成的内容——但不是禁止。Devin有全文报道。
  • \n\n\n\n
  • 以你的声音应答电话:Truecaller这家家喻户晓的来电识别服务很快将允许客户使用其AI助手以自己的声音应答电话,这要归功于与微软新签订的合作协议。
  • \n\n\n\n
  • Humane考虑出售:Humane,推出不温而居的人气产品Ai Pin的公司,正在寻找买家。据报道,公司的售价在7.5亿至10亿美元之间,销售过程处于早期阶段。
  • \n\n\n\n
  • TikTok转向生成式人工智能:TikTok是最新一家将生成式人工智能纳入其广告业务的科技公司,该公司周二宣布推出全新的TikTok Symphony AI套件供品牌使用。这些工具将帮助营销人员撰写脚本、制作视频以及增强他们目前的广告资产,Aisha报道。
  • \n\n\n\n
  • 首尔AI峰会:在首尔举行的一次人工智能安全峰会上,政府官员和人工智能行业高管一致同意在这个快速发展的领域应用基本的安全措施,并建立一个国际安全研究网络。
  • \n\n\n\n
  • 微软的AI电脑:在本周年度Build开发者大会的两场主题演讲中,微软展示了一款被称为Copilot+ PC的新系列Windows机器(以及Surface笔记本电脑),以及生成式人工智能功能,比如Recall,帮助用户找到他们过去查看过的应用程序、文件和其他内容。
  • \n\n\n\n
  • OpenAI的声音问题:OpenAI正在移除ChatGPT文本转语音功能中的一个声音。用户发现这个名为Sky的声音与斯嘉莉·约翰逊(曾经扮演过人工智能角色)非常相似,而约翰逊本人发布了一份声明,称她已经聘请了法律顾问来询问Sky声音的具体细节及其开发方式。
  • \n\n\n\n
  • 英国自主驾驶法律:英国关于自动驾驶汽车的法规现在已正式获得皇家同意,这是任何立法必须在成为法律前接受的最终批准。
  • \n
\n
\n
\n\n

更多机器学习

\n

本周有一些有趣的与人工智能相关的研究成果。华盛顿大学多产研究员Shyan Gollakota再次推出了一款噪声抵消耳机,您可以提示它屏蔽一切除您想听的人之外的声音。佩戴这款耳机时,您看着那个人按下按钮,它会采样从特定方向传来的声音,然后用于启动一个听觉排斥引擎,从而过滤掉背景噪音和其他声音。

\n
\n
\n

这项由Gollakota及几名研究生领导的项目被称为“目标语音听力”,上周在檀香山的一次会议上展示出来。这不仅是一种无障碍工具,也是一种日常选择,而且绝对是您可以看到大型科技公司为下一代高端耳机窃取的功能。

\n\n
\n
\n
\n\n

EPFL的化学家们显然厌倦了执行18项特定任务,因为他们已经训练出一个称为ChemCrow的模型来代替他们。不是现实生活中如滴定和吸量这样的工作,而是规划类的工作,如筛选文献和规划反应链。当然,ChemCrow并不是为研究人员做所有工作,而是更像一个自然语言接口,根据需要使用任何搜索或计算选项。

\n
图片来源:EPFL

展示ChemCrow的论文的主要作者表示,它“类似于能够使用计算器和数据库的人类专家”,换句话说,一个研究生,因此希望他们可以从事更重要的事情或直接跳过无聊的部分。这让我想起了Coscientist。至于名字,它的由来是“因为乌鸦众所周知地善于使用工具”。够好!

\n\n
\n
\n
\n\n

迪士尼研究的机器人专家正在努力让他们的创造物更加真实地移动,而不必手动为每种可能的动作进行关键帧动画。他们将在7月的SIGGRAPH大会上展示的一篇新论文展示了结合程序生成动画和艺术家界面进行调整的组合,所有这些都在一个双足机器人(一只格鲁特)上运行。

\n

理念是你可以让艺术家创建一种类型的运动——弹性、僵硬、不稳定——工程师们不必实现每一个细节,只需要确保它在一定参数内。然后它可以动态执行,建议的系统本质上即兴产生确切的动作。预计在几年后在迪士尼乐园中见到这项技术…

\n
\n
\n