澳大利亚开发者试用DeepSeek称其成本降低至原来的五分之一

测试人员表示,这个中国人工智能平台与OpenAI和Anthropic不相上下,提供了“惊人的性能水平”,但运行成本大大低于它们。

Matt Boustred和Henry Badgery在二月的第一个周末蜗居在办公室,试图找出这一人工智能领域的新兴技术是否真实回馈了外界的期待。

AI咨询公司Fourday的联合创始人自去年十二月以来便开始尝试中国人工智能公司DeepSeek的技术,但现在其推理模型R1在Fireworks.ai平台上可用,该平台允许公司访问数百种AI模型,他们希望看看这一低价模型的真正聪明之处。

此前,相对不知名的DeepSeek在金融市场上引发了波动,一天内使芯片制造商Nvidia的市值蒸发了6亿美元。与此同时,投资者正在消化新闻对芯片制造商及ChatGPT的拥有者OpenAI意味着什么,开发者们迅速捕捉到以极低成本运行AI服务的机会。

DeepSeek的开源模型可以独立于创建它的中国公司下载和运行在私人环境中。美国科技巨头Microsoft、Amazon和Google已经通过其云计算服务提供该模型,AI搜索引擎Perplexity甚至已经对DeepSeek的模型进行了微调,因此如果你问它,它会告诉你有关天安门广场的信息。

“作为一个中国模型,显然当其由DeepSeek托管时,你不想向其输入任何敏感或机密数据。实际上,过去两个星期,它才被托管在更可靠的服务提供商上,因此我们主要是在内部进行实验,”Boustred说。

Boustred表示,最初的兴奋部分源于开发者们认为开源社区在创建类似OpenAI所开发的推理模型方面相对落后,而这些模型旨在在响应解决复杂推理任务前花费更多时间思考。

“R1的出现简直是出其不意,它提供了一个惊人的性能水平。令人惊讶的是,你实际上可以下载该模型,在自己的服务器上托管并进行微调,”他表示。

与他们遇到的任何新AI模型一样,Fourday的创始人正在测试DeepSeek的长期表现,然后再决定是否将其应用于面向客户的项目。

到目前为止,结果非常乐观。在一次实验中,Boustred和Badgery使用DeepSeek的R1模型处理年度报告和公司数据,10分钟内生成了一份20页的研究报告。

不仅性能与OpenAI和Anthropic开发的模型的结果相当,运行成本却低了五倍。Boustred估计,利用DeepSeek的模型,生成一份研究报告的费用可以从50美元降至不到10美元。

“许多更复杂的用例在测试中看起来很酷,但当你想到如何将其扩展到每月成千上万的使用时,成本就显得过于高昂了。”

与OpenAI的01模型相比,通过Fireworks使用DeepSeek的模型进行文本处理与生成——其中文本被分解为称为tokens的单元——要便宜得多。Boustred表示,OpenAI对每百万个输入tokens收取15美元(24美元)和每百万个输出tokens收取60美元,而Fireworks的R1则定价为每百万输入tokens 3美元和每百万输出tokens 8美元。

“如果开源与闭源相竞争,这将对价格产生下行压力,使AI产品能够以更低的成本呈现给消费者,”Boustred说。

董事会中的“无望之举”

联邦政府决定禁止在政府手机和计算机上安装聊天机器人应用,这使得许多大型公司在考虑试验底层AI模型时感到寒意。

澳大利亚一些最大的公司——也是人工智能最热情的采用者——如联邦银行、国民银行、Telstra、TPG和Woolworths,已明确表示不会使用DeepSeek的模型。

“我们密切关注AI领域的最新发展,包括新开源模型的发布。在DeepSeek的案例中,我们不使用它,也没有当前使用的计划,”联邦银行的发言人表示。

Woolworths的发言人说:“谷歌的Gemini是我们唯一批准的数据和AI平台,DeepSeek在我们业务中不以任何形式应用。”

Lightspeed Venture Partners的澳大利亚合伙人James Alcorn表示,像金融服务或医疗保健这样高度监管的行业中,几乎不会有R1模型的使用。“对于大多数,甚至可能是绝大多数大型跨国企业而言,部署在中共幕后的模型R1绝对不会在董事会中获得讨论,”Alcorn说。

“数据来源问题、监管合规和声誉风险可能让高管们难以克服。”

Alcorn预测,得益于美国与中国之间的人工智能军备竞赛,企业有可能在不到六个月的时间里获得比R1更好的开放推理模型,最有可能来自Meta。

数据本地存储

Sri Annaswamy,外包和分析咨询公司Swamy and Associates的创始人表示,DeepSeek的R1模型在他的客户中需求旺盛,他们对以现有预算做更多的前景感到兴奋。

他估计,DeepSeek降低的计算成本将在一个典型的12周开发项目中为公司节省60,000至80,000美元。

“实际上,这足以支持另外两个项目,”Annaswamy说。

本月,这家咨询公司开始为两个客户测试R1。一个是动产开发商,正在试验AI如何总结数十年的土地记录以帮助评估土地污染;另一个是保险公司,利用AI分析索赔文件,以识别索赔参与者之间的勾结或欺诈。

“在这两种情况下,数据是在澳大利亚本土存储的,并由这两个组织的首选云服务提供商在本地云实例中管理,因此没有数据被发送到海外,”Annaswamy说。

迄今为止,最明显的区别在于价格。使用R1显著降低了计算成本。

“这对最终用户组织中的应用开发者,尤其是那些当前无法承担访问基础模型成本的小型和中型企业来说,无疑是好消息,”Annaswamy表示。

“简单来说,尽管大型科技公司一直在谈论民主化AI,却始终保持专有代码,DeepSeek实际上已经走上了民主化之路。”

Annaswamy表示,任何对DeepSeek的使用都将局限于概念验证阶段,直到组织的首席信息安全官和责任AI团队完成对该模型的正式评估。

“自从最初公告以来,关于安全和地缘政治方面的担忧——尤其是数据安全和数据盗窃问题——都被强烈提出,但大部分可以完全驳斥,只因为开源模型如R1的运作方式。”

“你几乎可以复制源代码,做你想要的修改,然后在你首选的云服务提供商提供的本地数据中心运行,而无需任何数据被传输到中国。”

DeepSeek的R1模型展现了强大的推理能力和优越的性价比,打破了对中国AI技术的偏见,提供了企业降低成本的新机遇。然而,尽管技术潜力巨大,但由于数据安全和监管问题,许多大公司依然对其持审慎态度。市场未来竞争中,开放源代码模型将可能成为主流,推动人工智能服务的民主化进程。

予人玫瑰,手有余香

给TA喜欢
共0人
还没有人赞赏,快来当第一个赞赏的人吧!
    国际新闻

    澳大利亚 - 拜登政府拟为国际创业者开大门 料将吸引大批中国人申请(组图) | 澳洲唐人街

    2021-5-14 23:09:30

    文学世界

    澳大利亚 - 共和党谴责“倒戈”众议员 川普卸任仍具党内影响力 | 澳洲唐人街

    2021-2-3 21:04:17

    个人中心
    今日签到
    私信列表
    搜索