产品展示
PRODUCT DISPLAY
牛宝体育官网您现在的位置:首页 > 新闻中心 > 技术文章

王海峰:语言与知识布局要把握技术与产业两大趋势

  • 发布日期:2024-04-24 04:39:38
  • 来源:牛宝体育app

      自然语言理解(NLP)素有“人工智能皇冠上的明珠”盛誉,这也意味着语言与知识等认知层面的技术突破将进一步促进AI深入发展。

      8月25日,以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会举行,百度CTO王海峰发表主旨演讲,解读百度语言与知识技术的发展历程与最新成果,与产学研各界分享技术及产业发展趋势和展望,百度集团副总裁吴甜和百度技术委员会主席吴华分别发布百度语言与知识技术系列产品和数据集共建计划,重磅推出5款产品的新发布,全面加速AI技术大规模应用。这是一场凝聚了百度在语言与知识领域十年技术积累和产业实践的盛会,必将带来深远影响。

      语言与知识技术是人工智能认知能力的核心。2010年,百度成立自然语言处理部,在前瞻技术与产业格局上不断引领、创新,十年间已成为中国NLP发展的一面旗帜。

      峰会上,王海峰回顾,“在百度语言与知识技术的布局和发展中,我们始终在注意把握两个趋势,即技术发展趋势和产业发展趋势,并力争引领趋势。”

      纵览百度语言与知识技术发展历程,从研究方法、研究对象、研究方向、产业应用等各个层面,布局完整,不断打磨成熟,始终与应用的发展趋势、需求一脉相承,与产业接轨。

      十年来,百度大脑语言与知识技术成果丰硕,获得包括国家科技进步奖在内的20多个奖项,30多项国际竞赛冠军,发表学术论文超过300篇,申请专利2000多项。技术不断突破创新的同时,也在产品上创新探索,同时将领先的技术输出给开发者与合作伙伴,提升各行业智能化水平。

      首先,知识图谱是机器认知世界的重要基础,百度打造了世界上最大规模知识图谱,拥有超过50亿实体和5500亿事实,并在不断演进和更新。百度知识图谱应用于各行各业,每天的调用次数超过400亿次。

      其次,在融入知识的基础上,语言理解能力不断增强。2019年3月,百度提出知识增强的语义理解框架ERNIE,在深度学习的基础上融入知识,同时具备持续学习能力,曾一举登顶全球权威数据集GLUE榜单,首次突破90分大关,刷新榜单历史。基于知识图谱和语义表示,突破了阅读理解、对话理解以及跨模态深度语义理解等技术。

      第三,语言生成是语言与知识技术中的重要组成部分。基于预训练技术的成功经验,百度提出基于多流机制的语言生成预训练技术,兼顾词、短语等不同粒度的语义信息,显著提升生成效果。百度也探索了多文档摘要生成,通过图结构语义表示引入篇章知识,在单文档和多文档摘要生成效果都有提升。

      应用系统层面,对话系统和机器翻译等成绩卓著。百度提出了知识图谱驱动的对话控制技术,以及首个基于隐空间的大规模开放域对话模型PLATO等,并推出智能对话定制和服务平台UNIT,帮助开发者高效构建智能对话系统,实现规模化应用。百度翻译支持200多种语言,每天响应超过千亿字符的翻译请求,支持超过40多万家第三方应用,技术上,提出了多智能体联合学习、基于语义单元的同传模型、稀缺语种分组混合训练算法等。

      百度大脑语言与知识技术的持续探索和创新取得了令业界瞩目的成绩,同时这些技术以平台化的方式输出,赋能千行万业,持续提升产业智能化水平。

      王海峰首次发布了百度大脑语言与知识产品全景图。百度集团副总裁吴甜接续发布语义理解技术与平台文心、智能文档分析平台TextMind和AI同传会议解决方案3大新产品,同时发布了6项升级,包括智能创作平台的3个场景方案、以及智能对话定制与服务平台UNIT的3项全新升级。

      吴甜表示,“我们一直致力于将语言与知识技术凝聚成一系列技术平台和产品,在应用中产生大量价值,为广大开发者和产业实践者提供以语言与知识技术为核心驱动的系列产品。”

      百度推出的语义理解技术与平台文心,基于深度学习平台飞桨打造,依托领先的语义理解核心技术,集成优秀的预训练模型、全面的NLP算法集、端到端开发套件和平台,提供一站式NLP开发与服务,让开发者更简单、高效地定制企业级NLP模型。文心经过了大量真实应用场景的淬炼,具备优秀的工业级落地实力。

      全新发布的智能文档分析平台TextMind,基于OCR、NLP技术,以文档解析为核心能力,支持文档对比与文档审核,具备“多快好省”的核心优势,促进企业办公智能升级。

      百度大脑智能创作平台针对媒体应用场景再升级,全新推出智能策划、智能采编、智能审校三大媒体场景方案,进一步助力媒体人更快、更好地创作,可谓切中媒体人的“痛点”。

      智能对话定制与服务平台UNIT升级3大特性:更智能的任务式对话理解、极致便捷的表格问答和融合通用的新对话引擎。此次UNIT全新升级的三大能力,将进一步降低任务式对话、智能问答的定制成本,并融合通用对话能力,提升交互体验。

      全新发布的AI同传会议解决方案,覆盖会议全场景、全流程,旨在打造用户随身的“会议同传专家”。吴甜现场展示了如何只用一台电脑和一部手机快速搭建一套同传服务,只需点点鼠标、打几个字,就能快速获得专业的同传服务。

      数据匮乏、算力不足历来是语言与知识技术研发中面临的瓶颈。为突破瓶颈,百度联合中国计算机学会、中国中文信息学会发起中文自然语言处理数据共建计划——千言,解决数据稀缺问题。千言一期由来自国内11家高校和企业的数据资源研发者共同建设,已涵盖开放域对线余个中文开源数据集。

      百度技术委员会主席吴华表示,“未来,我们希望有更多的数据集作者能够参与共建千言,共同推动中文信息处理技术的进步,建设世界范围的中文信息处理影响力。我们计划在未来3年,面向20多个任务,收集和建设不少于100个中文自然语言处理数据集,覆盖语言与知识技术全部领域。”

      (百度技术委员会主席吴华(中)与中国中文信息学会副理事长兼秘书长孙乐(左)、中国计算机学会自然语言处理专委会主任周国栋(右)一起正式启动千言计划)

      吴华还发布了百度语言与知识技术算力共享计划,通过百度AI STUDIO平台提供算力支持,让广大开发者破除算力桎梏,专注于技术创新。

      十年征程,百度语言与知识技术发展历程中培养、吸引了大量全球顶尖人才。会上,百度推出以王海峰为代表的百度NLP“十年十人”,十年坚守,不忘初心,秉持“技术信仰”,勇攀技术高峰,矢志不渝致力于让机器更好地理解世界、更好地服务于人。

      正如王海峰所言,“我们致力于更好地与学术界、产业界携手,推动语言与知识技术发展,进而推动人工智能技术持续进步,为产业智能升级、社会经济高质量发展贡献力量。我们对未来充满信心,坚持研究和发展让机器掌握知识、理解语言、拥有智能,继续突破和创新,为技术和社会进步做出更大贡献。”(一鸣)

      7月13日,中国交通运输部广州打捞局在广东阳江海域成功安装全球首台抗台风型漂浮式海上风电机组。该座风电机组最高可抗17级台风,单机容量5500千瓦,每小时满发电量可达5500度,每年可为3万户家庭提供绿色清洁能源电能。

      这个夏天,云南野生亚洲象群北移事件备受关注。自2020年3月从西双版纳出发,这支被称作“断鼻家族”的野生亚洲象群开始一路“象”北,直到近期,移动轨迹才终于显露出南返迹象。

      伴随着技术进步,人类对宇宙中性氢气体的21厘米线进行精确观测已成为可能,21厘米宇宙学正快速进入人们的视野,成为天文学家探索宇宙大尺度结构、暗物质分布、暗能量状态方程的强有力工具。

      进入盛夏时节,我们最熟悉的牛郎星和织女星将在夜空中登场,并在七八月份成为星空的主角。今年7月的夜空里,还可以见到五大行星。

      6月25日,成都高新区政务服务和网络理政办公室组织举办“成都高新区智慧城市建设专题培训暨智慧治理开放日”。会上,该高新区分享了目前“城市大脑”的建设成果,在数据基础支撑方面,已建立高新区数据资源体系,累计汇聚数据超18.6亿条,构建经济运行等专题数据库32个。

      从最初的一个月寥寥数船,到10天3船,再到11天6船,10年来,江苏LNG接收站船舶接卸数不断刷新纪录。简单的数字背后,折射的是江苏乃至长三角加快能源结构调整、坚持高质量发展的决心。

      由于太阳风的带电粒子与木星大气相互作用,木星和地球一样,在极区也有极光产生。不过,与地球的极光不同,木星的极光具有高能量,由X射线构成,并且每隔几分钟就会暴发一次。

      根据英国《自然·衰老》杂志12日发表的最新研究,科学家利用人工智能研发的一种新的“衰老时钟”——iAge,其为全人类提供了及时发现心血管疾病等患病风险上升的新方式,并能预测患病风险会上升的个体。

      记者从中国科大获悉,该校郭光灿院士团队李传锋、许金时等人与合作者合作,在国际上首次实现了单个碳化硅双空位色心电子自旋在室温环境下的高对比度读出和相干操控。

      7月9日,中国科学院在黑龙江省哈尔滨市发布了《东北黑土地白皮书(2020)》,这是国内首次发布黑土地白皮书。该白皮书是中国科学院基于40多年对黑土地的研究成果,并融汇国家相关部委的调研数据以及科研机构和高等院校科学家的研究资料形成。

      2019年综合指数达117.05点,2020年达139.41点,比上年分别提高了17.05点、19.1点,年均增长18.07%……7月11日,全国首个县域创新驱动发展指数公布评价结果,该指数对江苏张家港市进行分析研究,结果显示各分项指数均保持上升态势。

      记录焊接工艺案例笔记近20大本;攻克冶金、矿山、机械、电力等行业400多项焊接技术难题;改进焊接工艺100多项;创造直接经济效益5000多万元。

      记者12日从中国科学院昆明植物研究所了解到,该所昆明植物园定植于所史馆前的一株西畴青冈近日结出了形似小馒头的幼果,这是该物种首次在昆明植物园开花结实。

      以“开启航海新征程,共创航运新未来”为主题的中国航海日主论坛,于7月11日以线上形式在云南昆明举行。据论坛消息,随着信息化技术的发展,以智慧港口、智能航运、绿色航道为代表的航运新基建,逐渐成为我国推动航运高质量发展的新引擎。

      这场降雨为何来得如此迅猛?华北雨季是否正式开启?降雨还将持续多久?公众应当如何防御?中央气象台首席预报员张芳华对这场雨进行了全面解读。

      7月12日,记者从中国科学院物理研究所获悉,该所自主研发的无液氦稀释制冷机成功实现10mK(绝对零度以上0.01度)以下极低温运行。这标志着我国在高端极低温仪器研制上取得了突破性的进展。

      让赵淳生着迷的超声电机,是上世纪80年代发展起来的一种全新的微特电机,具有轻便、响应快、控制精度高、噪音低等特点,在照相机、手表、机器人、汽车、航空航天、精密定位仪、微型机械等领域有广泛的应用前景。

      7月12日,由自然资源部组织的中国第12次北极科学考察队搭乘“雪龙2”号从上海出发,前往北极执行科学考察任务。本次考察是“十四五”期间我国组织开展的首次北极科学考察活动,预计总航程约1.5万海里,9月下旬返回上海。

      近日,深圳落实综合改革试点又一成果落地——《深圳经济特区数据条例》(以下简称《条例》)在深圳市人大常委会网站公布,并将于明年1月1日起实施。这是国内数据领域首部基础性、综合性立法。《

    联系方式
    • 电话

      86-021-69155901

    • 传真

      86-021-69155906

    在线客服