百度文心一言现在能用吗?
有ChatGPT的火爆在前,大家对文心一言的期待也很高。而文心一言做到似乎也不负众望,在第一次正式亮相的时候就向大家展示了其不仅具备其它AI大模型所具备的典型能力,也同样做到“人有我有,人有我优,以及人有我待优”。
从新闻发布会现场演示来看,文心一言在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等方面有突出能力。
在文学创作能力上,文心一言可以做到总结、分析、内容、检索,延伸至检索增强。而这得益于百度多年以来成熟的搜索业务提供的丰富数据库。基于搜索业务积累,百度有世界上最大的知识图谱,一直致力于给用户提供唯一答案。这一切让文心一言回答准确性及生成结果的可信度得到提升。
在这个能力的基础上,文心一言在起名字、写新闻稿、写标语等能力上的延伸智能涌现。文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,及5500亿事实的知识图谱。因此百度在中文语言的处理上,处于独一无二的位置。
有研究表明,数据规模大,参数达到千亿级,大模型就可能发生“智能涌现”,涌现出知识和逻辑推理能力。不仅仅是数据规模,百度的数据形态也最贴合回答和生成需求。在百度搜索中,问答和生成类的搜索请求占比很高。因此文心一言大模型,在自然语言问答和创意内容生成上有突出表现。
当然,作为一个大语言模型的生成式AI产品,文心一言也具备的复杂推理,把问题拆分为子问题解决的能力。
如果说以上都是一个AI模型的必备能力,那文心一言作为诞生出中国的AI模型,还具备了其独特之处。
文心一言的中文语言处理上独一无二,扎根中国市场,理解中国文化,最先进的自然语言处理能力。同时,文心一言具备图片、音频及视频等多模态生成能力。多模态是生成式AI一个明确的发展趋势。未来随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力,也会不断提升。