2022年07月18日 第895期

思必驰发布通用大模型DFM-2,满足行业精度的需求

时间:2023-07-18 14:29:25  来源:

自去年下半年起,在ChatGPT带动而陡然升温的人工智能创新热潮中,大模型产品已成为AI领域的兵家必争之地。从初期对大模型的技术热情,转变为对商业化落地冷静思考。而大模型的落地,正是所有大模型研发企业都需要认真思考的话题,对于我国苏州本土人工智能企业思必驰而言也不例外。

发布通用大模型

近日,思必驰发布了拥有百亿级参数的通用大模型“DFM-2”(Dialogue Foundation Model-2),思必驰联合创始人、首席科学家俞凯在当天的发布会上称之为“相对大规模的行业大模型”。

根据中国科学技术信息研究所近期发布的《中国人工智能大模型地图研究报告》,截至今年5月底,我国至少已发布79个规模在10亿级参数的基础大模型,然而,尽管通用大模型在聊天、娱乐等通识属性较强的场景上表现颇佳,但在具体落地的行业应用场景还难以实现大规模商业化。

在思必驰看来,人工智能技术和大模型产品应用落地的主要矛盾,依旧为技术厂商的通用型技术与B端企业高度灵活的个性化需求之间的矛盾。通用语言大模型在行业应用中往往会面临着私域知识难包含、不准确,判别式任务精度及时效性不足,数据安全和计算可信问题,以及成本高、速度慢等问题。很难有通用的语言大模型能够把这些问题都解决掉。思必驰则基于通用人工智能技术不断发展完善自身的规模化定制能力和产品标准化能力,支持客户自主构建“千人千面”的个性化语音交互解决方案,实现了人机口语对话系统的“柔性批量制造”。

“大模型并非越大越好。”在当天的发布会上,俞凯提出了这样的观点。

“当你需要极为广泛的知识的时候,你的模型需要特别大。”俞凯解释道:“但当你只需要相对来说比较专一的行业知识的时候,你的模型不一定特别大,当然也可以大,但不一定特别大。具备了一般的通用智能的能力、通用的认知能力,再加上合理的知识记忆能力,我们就有可能形成一个合理的大小来去解决行业问题。横向全域的通用模型和纵向垂域的通用模型都是通用人工智能。”

基于上述现状,思必驰的野望是建立一个应用级语言计算大模型,它既有相当的规模适用性,又能满足行业对精度的需求,以此在激烈的市场内卷当中站稳脚跟。

在一片红海之中,思必驰如何突出重围,构建优势?显然,它看中的是智能硬件交互这一有着自身基础优势的应用场景。具体而言,这些场景主要包括了智能汽车、智能家居、政务服务、医疗健康以及科学研究范式。

提升五大核心能力

在应对行业落地挑战中,DFM-2大模型对人机语言交互五大核心能力进行了提升,其中包括:

(1)外部信源增强的精准推理决策,可为用户提供更复杂、更准确、更实时的信息服务;

(2)基于深度认知的通用语义理解,可有效提升产品的口语理解能力和交互准确率;

(3)基于文档理解的可信主动知识问答,可基于DocDFM进行文档解析,为用户提供售后客服、法律咨询等服务;

(4)面向用户个性化的多人设交互,支持单设备多角色,灵活切换,提供差异化的服务;

(5)面对复杂任务的自动规划与执行,通过大模型可以对机器人执行的任务进行拆解和规划,生成每一步的控制代码,使机器人完成对应任务。

7月13日,俞凯在接受SISPARK独家采访时,进一步阐明了思必驰在大模型产品落地方面的发展思路。

“很明显,在提升智能硬件交互的用户体验方面,思必驰有很多的工作要做。”俞凯说:“DFM-2大模型会大幅度提升思必驰在原有的沟通万物方面的影响力,在智能汽车、智能家居、企业信息处理、政务信息处理等领域的人机交互方面,这种赋能将使我们迈上一个新台阶。”

“思必驰在获批建设国家语言计算创新平台的同时,一直在推进大模型的研发。”俞凯说:“我们一直在建立语言中心和知识中心,形成一个更完整的方案解决架构。大模型本身可以将政务信息处理和企业信息处理平台化,以信息处理的方式赋能数字化。苏州一直在提及基础设施建设,但我认为,在DFM-2大模型正式发布之后,思必驰能够更好地把人工智能的基础设施落地。我们的语言大模型基础设施将融入我们的知识中心和语言中心,成为一个更完整的解决方案架构。”