领途商业学堂
(资料图)
第75期
当下,聊天机器人ChatGPT当之无愧已经成为科技圈的“顶流明星”,最新发布的GPT-4直接海啸式引发了全球的关注和讨论。
海外前有微软新版Bing,后有谷歌对话式AI服务Bard,国内的各赛道的龙头也不甘落后,百度、腾讯、阿里、京东、科大讯飞等积极下场,都不甘也不敢成为这场AI革命中的落后者。
京东产业版ChatGPT ChatJD率先落地,并未引起太大波澜;百度文心一言如期上线,却引发了全网群嘲。短短几个月时间,科技大厂争先恐后奔向这一AI竞赛——这也成了其AI技术储备的“突击检查”,毕竟AI在国内也并非新生事物,早已成为各个科技企业反复提及的名词,但是如今潮水退去,谁的大金链子漂在水面一目了然。
难道中国人真的做不出ChatGPT?其实未必。
|01
ChatGPT出圈
主要靠这三件事
在ChatGPT火了之后,很多人可能都有一个疑问,聊天机器人的产品并不少见,为什么偏偏是ChatGPT?
其实聊天机器人早已深入我们的生活,例如大家熟悉的Siri、Google Assistant、亚马逊 Alexa、三星 Bixby,如今连智能电视等智慧家居都配备了AI助手,但是在以往的聊天机器人对话场景中,使用者能够明显地感知到——对方是个机器人。
与“人工智障”形成鲜明对比的ChatGPT实在太聪明了,它能够学习和理解人类的语言并进行对话,在互动过程中根据上下文进行互动,让你仿佛在和真人面对面交流。除此之外,它还可以写邮件、脚本、文案、代码,将你的意图尽可能精准地呈现出来。如今最火的“靠ChatGPT在家赚钱”等热门话题,正是依赖于其强大的对话功能。
更让人惊叹的是,ChatGPT还可以完成更为复杂的推理和学习任务,基于其对上下文的理解,在人类的适当引导下完成逻辑推理、新知识快速学习等。
分析认为,ChatGPT呈现出的初步“智慧涌现”,至少可以总结为五个维度的能力:海量高价值信息的全量在线记忆能力、自然语言输入的任意任务和多轮对话理解能力、复杂逻辑的思维链推理能力、多角色多风格的长文本生成表达能力、即时新知识学习应用于进化的能力。
生长于英文世界的ChatGPT,在中文应用过程中出现了大量的“水土不服”,但是经过用户的反馈和引导,ChatGPT能够快速理解并调整其回答,这是以往的AI对话机器人完全无法比拟的。
这也证明了ChatGPT背后除了算法创新外,还需要高质量训练数据、创新模型训练算法以及AI工程化等多方面综合应用。此外,该模型需要基于数万个Prompt任务的统一生成范式有监督训练,才能够提高大模型对语义和知识表征的泛化及准确理解能力。
在这些综合因素的作用下,ChatGPT才能够取得如此显著的应用效果。这也侧面说明了落地类ChatGPT技术需要考量的因素非常多,如果没有长期的技术积累,珠玉在前所得到的自然只会是群嘲。
|02
算法、数据、算力…
AI国家队的杀手锏
目前国内已经诞生了多个基于文本或多模态的预训练基础模型,这些与训练基础模型与国外基础大模型算法的差距不大,奠定了比较好的大模型训练平台基础,并进行了算法模型的框架积累。
因此,国内玩家想要打造类ChatGPT大模型,创新才是关键,需要在数据、算力、工程实现上下功夫——既需要打造高质量的预训练模型,又需要有足够的算力支持。
这些东西,科大讯飞恰好都有。
在核心算法上,ChatGPT主结构是当前业界主流的Transformer模型,目前科大讯飞已经将Transformer深度神经网络算法应用于产品的语音识别、图文识别、机器翻译中。并且科大讯飞还开源了6大类、超40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超千万。
在数据积累上,行业认知大模型想要达到人类专家水平,需要大量行业文本语料和用户反馈数据做支撑,既要涵盖多行业、多领域,还需技术加人工实现双重筛选,从而提高模型输出的可靠性、合理性和可控性。
据科大讯飞副总裁、研究院执行院长刘聪透露,科大讯飞在多年积累和研发过程中,已经拥有超过50TB的行业语料和每天超过10亿人次用户交互的活跃应用。
在核心算力上,科大讯飞总部合肥数据中心在工程技术方面能够实现百亿参数大模型推理效率的近千倍加速,这也是其大模型能够落地并实现规模化应用的基础。
在技术储备之外,科大讯飞的应用场景十分明确。宣布将于5月正式发布的类ChatGPT落地应用,将优先使用自家的AI学习机上。毕竟,在智慧教育领域,科大讯飞佳绩满满,全场景因材施教解决方案已经服务了5万多所学校、1.3亿师生。
此外,科大讯飞在医疗领域的积累同样丰富,其“智医助理”系统,可以作为全科医生助手诊断1200多种常见病,累计提供了5.5亿次AI辅诊建议。
基于以上考虑,科大讯飞计划推出“1+N”架构,提高大模型在细分行业的实用性——“1”是指以通用认知智能大模型算法研发及高效训练底座平台,“N”是针对多个行业领域的专用大模型版本,例如教育、医疗、汽车、办公、翻译、工业等,围绕科大讯飞的核心技术展开布局——这也是科大讯飞对于AI研发、应用等更为宏观、长期价值的考量。
随着ChatGPT的风生水起,生成式AI让一众玩家处于资本的聚光灯下,股值成为了模型好坏的检验指标。
作为人工智能国家队的科大讯飞,多次成为ChatGPT概念股的焦点,对此,刘聪坦言:“对于科大讯飞来说,还是本着‘实事求是’的态度,紧跟国际最新发展,保持敬畏之心”。
虽然科大讯飞拥有着令人瞩目的相应技术积累,但是与国际大厂的差距也是无法忽略的。我们期待科大讯飞能够将这一波浪潮与自身优势相结合,跑出一条自己的路。
5月将近,让我们一起拭目以待。
*图片均来自于网络,如有侵权请联系删除热门标杆游学参访(点击文字了解详情)|||