我们是五月的花海,用青春拥抱未来。
这个五月,是AI的花海,竞相绽放,姹紫嫣红。
【资料图】
ChatGPT等AI产品出来的时候,友说:
人类天生就有梦想、创造和创新的天性。但今天,我们将太多时间花在枯燥无味的工作上。这些任务会消耗我们的时间、创造力和精力。要重新连接我们工作的灵魂,我们不仅需要更好的方法来做同样的事情,我们需要一种全新的工作方式。
首当其冲的是画师行业,一部分惶恐的画师掀起了对AI的抵制,甚至抛出了“尸块”论。遗憾的是,AI夜以继日不眠不休的进化,如今的AI绘画,已经完全有能力取代中低端画师。
其次对图文、视频创作者的降维打击,也在持续进行中。ChatGPT背后依赖的大模型,是人类3000年来几乎所有图文知识的总和,AI将其融会贯通,再结合lora微调模型,替代创作者量产图文和视频,也只是时间问题,这个时间可能只需要以月计算。
与其惊恐,不如拥抱它。
先说国外,ChatGPT4.0发布后,Claude很快发布,星空君简单试用了下,发现不亚于ChatGPT。
至少相当于GPT3.5,距离4.0有一定的差距,但好处是免费啊!还不用梯子(仅注册的时候需要一下梯子,使用不需要)!
真的没有任何关系吗?事实上,Claude和ChatGPT息息相关。
创造Claude的公司是Anthropic。
2020年底,OpenAI前研究副总裁DarioAmodei带着10名员工加入了“硅谷叛徒”俱乐部,拿着1.24亿美元投资创办了一个全新的人工智能公司Anthropic。
Anthropic的创始团队成员,大多为OpenAI的早期及核心员工,深度参与过OpenAI的多项课题,比如GPT-3、神经网络里的多模态神经元、引入人类偏好的强化学习等。
Anthropic的背后,是谷歌的身影,谷歌通过注资获得了10%左右的股权。
除了商业化的AI杀得天昏地暗,开源版的MiniGPT-4也发布了。
名字是不是很山寨?但技术并不山寨。
MiniGPT-4背后团队来自KAUST(沙特阿卜杜拉国王科技大学),是几位博士开发的。和ChatGPT相比,MiniGPT-4走了取巧的路线。
团队把图像编码器与开源语言模型Vicuna(羊驼)整合起来,并且冻结了两者的大部分参数,只需要训练很少一部分。
训练分为两个阶段。
传统预训练阶段,在4张A100上使用500万图文对,10个小时内就可以完成,此时训练出来的Vicuna已能够理解图像,但生成能力有限。
然后在第二个调优阶段再用一些小的高质量数据集进行训练。这时候的计算效率很高,单卡A100只需要7分钟。
如果你研究大模型,会发现有几个驼系列,它们都是来自于Meta 的开源 LLaMA(大羊驼)。
而骆驼科就三种... ...
比如Alpaca(羊驼)、Alpaca-Lora、Luotuo(骆驼)等,其中Luotuo是中国商汤几位大佬(但不代表商汤)做的开源版本。
终于说到中国的产品了,除了Luotuo外,清华大学团队的ChatGLM和复旦大学的Moss都提供了开源版本。
而ChatGLM的商用版本已经推出了第一个商业版应用:哈勃。
名字高大上吧?星空君认真去官网看了下,这是和上上签合作的AI审合同插件,属于相对简单的应用,但大大提升了工作效率。
星空君做过几年法务,除了没事背法条审合同搞内控外,还负责集团企业的合同管理系统,对合同线上管理的痛点了如指掌。AI解决了合同审核人员很难精准定位合同关键审批要件的难题,可以说大大解放了生产力。
但这个应用相对初级,应该后续会有更高阶的应用。对ChatGLM的未来,充满期待。
大厂们也没闲着,几乎有名有姓的大厂都推出或者正在推出自己的大模型。
最早面向C端用户放开的,是百度的文心一言,阿里的通义千问紧随其后。
有些人痛心疾首的认为中国的审查制度导致无法诞生ChatGPT,不知道这些人是不是装外宾,毕竟,你没有办法在国外的自媒体平台上讲摘棉花和吃西瓜以及107种性别,约束几个关键词多大点事... ...
这些所谓的ZZZQ难度要比中国的大得多。
中国各大厂的大模型和ChatGPT等相比,并没有代差,并且还在具体的应用领域有领先优势。
星空君最感兴趣的有两个,一个是腾讯的混元大模型,一个是科大讯飞的星火大模型。
为什么?
看好混元,是因为最优秀的中文语料库在微信公众号,这是其他大厂无法比拟的优势;
看好星火,是因为科大讯飞的语音识别全球最佳,即便是ChatGPT,也不支持语音识别,更别说讯飞都能听懂各地方言... ...
这个应用非常具有想象力。
大模型作为中介,人可以用真正的自然语言和机器交互。
类似的应用,谷歌曾放出来一个视频,人用语音指挥机器人去选零食和饮料。
这意味着,当AI和机器人技术足够发达,我们压根不用担心重度老龄化!
甚至连老人护理都可以AI化,也不用担心虐待老人。
关键词: