大模型结果“真假难辨”如何解决?对话天壤创始人、CEO薛贵荣:用这个技术丨WAIC 2023
(资料图)
7月7日下午,天壤创始人、CEO薛贵荣接受了《每日经济新闻》记者的专访。在2023世界人工智能大会上,该公司发布了一种大模型产品生态——“天壤小白”。其中包含最高1860亿参数的通用大语言模型、语义搜索引擎和开发平台。
目前,国内已是“百模混战”,天壤推出的大模型生态有何别致之处呢?薛贵荣首先向记者介绍了大模型存在的四大挑战,即大模型产生真假难辨的“幻觉”,所谓“一本正经的胡说八道”;政企私有数据的保密性要求,不能对外公开;缺少可靠的企业级中文大模型;大模型存在封闭性,无法自动更新信息。
关于天壤如何解决大模型“一本正经的胡说八道”,薛贵荣表示:“用‘提示词’去控制大模型,大模型还是会胡说八道。后来,有人尝试输入一些简单的上下文,以及对大模型进行fine-tune,但这个也不够。我们为了解决‘幻觉’问题,做了一个语义搜索引擎。先把需要的所有文档,放到语义引擎里面,比如法律书、知识库或者企业内部各种数据。该引擎使用了一个核心技术,即embedding。”
薛贵荣进一步解释:“生成式模型,最大的特点就是结果的不确定性。”那么,如何提高生成式模型的准确性呢?
薛贵荣认为:“现在给你100个字,你的答案就在这100个字里面总结。”那么是否为了提高准确性,限定生成(内容)的范围?薛贵荣回答称:“你只能用这里面的内容,做一次理解上的修饰。”
据其介绍,上述限制是放在推理端。简而言之,就是训练好大模型,为了得出一个精确值,在推理端限定一个范围。
薛贵荣介绍称,目前公司主要有三个团队,一个专门训练大模型;第二个是Fine-tune,做行业专用模型;第三个是做应用提示。
对于天壤小白大模型通过什么算力训练的?薛贵荣表示:“我们(基础)大模型的算力是租的,比如租用苏州超算(的算力),上海像商汤(的算力)我们也租。它们(商汤)有1万多张A100。另外,我们家里也有大概300张卡,以3090为主。”
封面图片来源:视觉中国
相关阅读
精彩推荐
- 大模型结果“真假难辨”如何解决?对话天壤创始人、CEO薛贵荣:用这个技术丨WAIC 2023
- 娄星区总工会积极参与无偿献血活动
- 男子在云南玉溪采菌遇到3只老虎?官方回应
- 外交部领事司提醒在美和拟赴美中国公民注意安全
- 虫草松茸膏多少钱一斤,松茸多少钱一斤
- 藏龙岛上的消防员,卧虎藏龙!
- 2023年07月10日[比亚迪概念]涨停板金字塔
- 再生资源如何持续释放绿色发展动能
- 别让孝顺变得廉价
- 7月10日三峡新材涨停分析:玻璃概念热股
- 神武山水各种坑_神武山水玄机图出什么
- 提前完成! 大渡河金川电站右岸趾板建设获新节点
- 迪丽热巴诉商行侵权
- 天健集团:2022年现金红利5.97亿元
- 中山市宝诚食品有限公司生产禁止生产经营的食品案
- 一周未来商业|马云现身巴基斯坦,Temu上线日本市场;美团发布第四代无人机,滴滴App重新上架后发布首份财报
- 深港金融合作新格局加速形成 300家机构入驻前海国际金融城
- 网传郑州花费34亿给河道贴瓷砖,官方通报:总造价650万元
- 7月10日讯,本周Mysteel标准干净铜精矿TC指数92.0—93.7美元/干吨,周均为92.7美元/干吨
- 创业板指涨逾2% 锂电池板块涨幅居前
- 新能源车下乡激活千亿蓝海市场
- 八八战略萧山实践 | 创新强区的萧山“营”法
- 40℃
- 塑料踢脚线安装方法(塑料踢脚线怎么安装)
- A股申购 | 苏州规划(301505.SZ)开启申购 应收账款占总资产比例超30%
- 2023年生态文明贵阳国际论坛|阿勒泰地区自然保护协会会长初雯雯:保护生态可以很简单,期待更多青年加入
- 支付宝被罚没30亿元
- 第二十届中国·内蒙古草原文化节:艺术的盛会 人民的节日
- 全聚德:全力推进堂食恢复和年夜饭预制菜销售
- 韩国在野党:对结论深表遗憾