继二次元AI作画之后,又一款AI应用火遍全网,在朋友圈里“霸屏”了。
当地时间11月30日,美国人工智能(AI)研究机构OpenAI发布了聊天机器人ChatGPT。许多人很快发现,不同于此前一些聊天机器人经常出现答非所问、言语混乱等问题,ChatGPT生成的答案不仅逻辑流畅,还能联系上下文语境进行连贯问答。
一位使用者告诉市界:“它可以说是目前为止最聪明的聊天机器人,只有你问不到,没有它不会答。”
(资料图片)
除了在网友中狠刷了一波存在感,ChatGPT的亮眼表现还让AI股重获关注。12月5日,国内智能人机交互企业汉王科技触及涨停板,有投资者表示:“AI以后要比人厉害了,ChatGPT、数字经济给汉王带来了最大的风口。”
当你问Siri“怎样应付老板?”时,Siri只能百度这个问题,再把3条搜索结果“转达”给你。而ChatGPT则能给出更“真诚”的建议:“建议你与他(她)直接沟通并尝试解决问题。通常来说,与老板和谐相处的最好方法是要尊重他(她)。”
当你细化问题描述,比如“我是程序员,怎么应付老板?”ChatGPT会针对职业给出更加详细的答案:“与老板相处的最重要的一点是要尊重他(她),并尽力为公司做出贡献。尽量按时完成任务,并确保自己的代码质量达到公司的标准。”
不仅如此,如果你继续追问“被老板发现了怎么办?”,ChatGPT还会在这一语境中,给出补救方案:“首先,你应该向老板道歉,并诚恳地表示自己会改进……同时,你还需要确保以后不会再犯同样的错误。”
这样顺滑、智能的沟通体验,让许多使用者直呼惊喜,并开始用其“整花活”。
有网友发现除了简单的日常对话,ChatGPT还可以回答特定学科的问题,比如“拉格朗日定理是什么?”“英语的虚拟语气该怎么用?”写段小说或代码对它来说也是手到擒来。有网友对此表示:“这样发展下去,程序员和写手都要失业了。”
国盛证券研报认为:“ChatGPT在寻找答案、解决问题的效率上已经部分地超越了如今的搜索引擎,ChatGPT或许在未来会改变我们获取信息、输出内容的方式。”
(图源:ChatGPT)
总结来说,ChatGPT上知天文下知地理,堪称“最强懂哥”。这样强大的AI模型,是全球顶级AI实验室OpenAI的手笔。
微软旗下的OpenAI与谷歌旗下的DeepMind、Meta(原Facebook)旗下的FAIR,被公认为全球AI领域最为领先的三大实验室。而本次凭借ChatGPT火出圈的OpenAI成立于2015年12月,最初为非营利性机构。
OpenAI的创始人之一是有“硅谷钢铁侠”之称的马斯克(Elon Musk),不过马斯克已经在2018年2月宣布退出OpenAI。
2019年,OpenAI宣布重组为一家“有限营利(capped-profit)企业”。具体而言,管理者们设置了一家非营利性的母公司OpenAI Inc,在这家公司基础上成立一家营利性的子公司OpenAI LP,并限制股东对OpenAI LP的投资回报上限。首批股东对OpenAI LP的投资回报被限制为不超过原始投资金额的100倍。也就是说,如果你投资1000万美元,你最多能得到10亿美元的回报。
正是在这一年,OpenAI宣布其获得了微软的10亿美元投资。
微软对OpenAI慷慨注资,绝不仅仅是看中了未来的财务回报,“醉翁之意”是在于OpenAI的前沿技术积累。而这项技术,同样是网红应用ChatGPT实现的基石。
从2018年起,OpenAI开始发布生成式预训练语言模型GPT(Generative Pre-trained Transformer)。GPT可用于生成文章、代码、机器翻译、问答等各类内容。接下来两年,OpenAI基本保持着每年发布一款模型的频率,分别在2019年2月和2020年5月发布了GPT-2和GPT-3模型。每一代GPT模型的智能程度,相较于前一代都实现了极大提升。
2020年9月,GPT-3发布不久,微软就宣布获得了GPT-3的独家授权、有权访问后者的底层代码。
此后,OpenAI似乎并不急于发布GPT-4,而是对GPT-3体现出的歧视偏见问题进行“修修补补”。比如在2022年初发布的AI模型InstructGPT,相比GPT-3能够生成更加友善的内容。
OpenAI称,本次爆火的ChatGPT是InstructGPT的“兄弟版本”。因此,业界普遍将InstructGPT和ChatGPT视为GPT-3.5版本。相比GPT-3,ChatGPT的主要提升点在于记忆能力,可以储存对话信息,延续上下文。
人工智能从业者谷雯告诉市界:“马斯克曾经说‘人工智能可能在2025年之前超越人类’,试用过ChatGPT之后,再联想到前段时间的AI作画,我觉得距离这一天的到来更近了。”
无论是AI作画还是聊天机器人ChatGPT,都可以被归类为AIGC(AI生成内容)。实际上,内容生成模型已经有近60年的发展历史。
早在1964年,全球首个聊天机器人ELIZA就已诞生。ELIZA的“人设”被设定为一个心理医生,可在心理治疗情境下,按照预先设定的模式组织语句,与真人进行对话。ELIZA仅有200行代码,但已能“骗过”使用者,被许多人认为是在与真实对象对话。
从ELIZA到ChatGPT,内容生成模型的智能程度无疑实现了代际的提升。在这背后,是数以亿计的数据和极大的算力消耗。
AI模型所依赖的深度学习技术,实际上就是通过不断输入数据,来调整运行算法的模型参数,使输出的结果最接近自然、真实的情况。在互联网发展至今数据量累积、计算设备软硬件迭代的基础上,才让ChatGPT有了成为“懂哥”的条件。
据国盛证券研报,ChatGPT有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面,GPT-3.5在微软Azure AI超算基础设施(由英伟达V100GPU 组成的高带宽集群)上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日)。
而在未来商业领域,ChatGPT及其类似的技术也有望发挥更大的价值。据浙商证券研报,ChatGPT模型的出现对于文字模态的AIGC应用具有重要意义。从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看,包括算力、数据标注、自然语言处理(NLP)等。
目前,国内许多企业已针对AIGC技术进行布局,比如百度推出的AI作画产品“文心一格”,抖音上线的AI绘画特效,腾讯上线的“QQ小世界AI画匠”活动等。
本次被ChatGPT“带上”涨停板的汉王科技则是一家以手写识别、OCR(光学字符识别)为核心技术,开发模式识别相关电脑产品的公司,在智能交互领域有所布局。
无论是《银翼杀手》等科幻电影,还是《AI新生:破解人机共存密码》等计算机专家的著作,都描述了在不远的未来,AI将实现“去工具化”、像人一样拥有创造力。
不过,在这之前,AI领域“模型越大、偏见越大”的问题还有待解决。如英特尔中国研究院院长宋继强曾提到的:“让机器‘像人’是很大的挑战。计算机现在最容易超越人的是计算和逻辑智能,但很难超越社交智能和认知智能。”
对于像ChatGPT这类用亿级数据训练出来的模型来说,怎样保证数据没有被有偏见、歧视的信息污染?怎样防止其被用于生成假新闻等有害信息?还是需要思考的难题。