WAIC 2023 | 张俊林:大语言模型带来的交互方式变革

如题所述

在2023年度WAIC AI开发者论坛上,业界翘楚张俊林发表了一场引人深思的演讲,他揭示了大语言模型如何引领交互方式的革新。张俊林坚信,自然语言正成为连接人类、机器以及AI的关键桥梁,它简化了操作流程,将大模型置于核心位置,负责处理日益复杂的任务。他的演讲焦点集中在两大关键领域:基座大模型(并非单纯指ChatGPT的突破)和命令理解能力,后者是ChatGPT得以广泛普及的关键因素。


大模型的变革核心在于自然语言交互,它将传统操作的繁琐过程转变为直接对话,如同苹果产品的直观操作。大模型的卓越能力体现在:



    强大的自然语言理解</:能准确解读人类的语言,具备高阶理解能力。
    任务规划与拆解</:将复杂任务分解成易于执行的步骤,如视觉编程中的识别、查询与标记。
    形式化语言转化</:潜在地转化为编程指令或API调用,提升工作效率。

以图片处理为例,用户只需简单指令,如“标记《生活大爆炸》中的主角”,大模型就能将任务分解为识别、查询、对应、标注和输出等步骤,实现高效自动化。


视频处理则挑战多模态任务,结合文本和视觉信息,虽然技术仍有提升空间。在结构化数据处理上,如表格、SQL和知识图谱,大模型如Office Copilot通过自然语言接口操作,但具体实现细节尚待揭晓。例如,大模型如LLM(如GPT-4)能处理销售数据表,通过预训练知识,如销售额计算公式,轻松应对用户查询。


大模型在销售数据分析中,如SQL-PaLM展示了在数据库操作中的潜力,接近实用水平,预示着未来可能无须手动编写SQL。知识图谱处理中,大模型通过查询和推理为用户提供答案。在具身智能领域,大模型已开始涉足语言理解、规划与动作执行,虚拟环境如《我的世界》成为实体机器人成本过高和数据获取困难的解决方案。在虚拟环境中,像英伟达的Voyage这样的技术,机器人通过大模型GPT-4进行环境探索,学习任务,从基础如伐木到高级如对抗僵尸。


未来的大模型可能由多个智能体组成,它们通过自然语言进行协作,调用外部工具以弥补不足。大模型通过API平台实现工具调用,智能体的定义也将在大模型时代迎来革新。然而,自然语言交互虽然便捷,但模糊性和歧义性也要求模型主动询问用户,以提升理解和准确度,这正是大模型持续优化的方向。


总的来说,大语言模型正在重新定义人机交互的未来,而张俊林的洞察无疑为这一变革提供了重要视角。让我们期待大模型在各个领域的深远影响,以及它们如何引领我们进入一个全新的智能世界。

温馨提示:答案为网友推荐,仅供参考
相似回答