元谋| 乌拉特前旗| 寿宁| 同德| 重庆| 西藏| 南安| 慈利| 黑水| 逊克| 江华| 蒲江| 滁州| 元氏| 卫辉| 鞍山| 长乐| 固阳| 贺州| 古蔺| 哈密| 恩施| 岳池| 开鲁| 华县| 高雄市| 景德镇| 临猗| 哈尔滨| 东海| 兴义| 迁西| 顺昌| 余干| 静宁| 南票| 彭州| 珠海| 福海| 中牟| 武宣| 彝良| 镇雄| 成都| 南丰| 额敏| 张掖| 郑州| 平昌| 洋山港| 宁南| 长泰| 美溪| 海伦| 韶山| 崇信| 抚州| 林甸| 灞桥| 旌德| 衡阳县| 梅里斯| 上海| 万安| 八一镇| 东阿| 范县| 资阳| 华宁| 云溪| 全椒| 高陵| 云霄| 铜鼓| 大城| 湖州| 民勤| 石狮| 英德| 安平| 伽师| 峨边| 桂林| 和林格尔| 云林| 白山| 岳普湖| 阿克塞| 本溪市| 城口| 正安| 招远| 青岛| 安福| 辽阳市| 平顶山| 江华| 新田| 吕梁| 鄂托克前旗| 信阳| 湖南| 林周| 顺平| 西峡| 大渡口| 临清| 临猗| 湖州| 敦煌| 独山| 亚东| 石景山| 武安| 麻阳| 白山| 南丹| 云溪| 图木舒克| 乌拉特前旗| 乌兰察布| 蓬安| 安平| 蓟县| 同心| 玉田| 当阳| 金阳| 田东| 乾安| 四子王旗| 都安| 丹凤| 东海| 安达| 商水| 乃东| 广丰| 云林| 天山天池| 孟村| 黑河| 新县| 二道江| 舞钢| 峨山| 皮山| 运城| 岚山| 泰宁| 巴里坤| 浪卡子| 山亭| 兴化| 阳城| 扬中| 隰县| 忻州| 太仓| 新丰| 戚墅堰| 南芬| 开原| 皋兰| 富源| 新河| 江陵| 兴安| 平塘| 洞口| 库尔勒| 永昌| 定日| 冷水江| 玉林| 建阳| 青阳| 新郑| 涿鹿| 兰坪| 喀什| 广水| 郸城| 博湖| 深泽| 南海镇| 加查| 察哈尔右翼后旗| 南安| 钟祥| 邳州| 灌阳| 铁山港| 梅河口| 长垣| 漯河| 武鸣| 东台| 富蕴| 临高| 芮城| 武胜| 新河| 伊川| 夏县| 沁源| 汝阳| 乾县| 临泽| 盖州| 自贡| 钟祥| 邵武| 定南| 万山| 东营| 平江| 钓鱼岛| 香河| 黑龙江| 唐海| 札达| 和静| 米林| 通化县| 崇礼| 都江堰| 绛县| 静乐| 黄石| 合山| 阳曲| 松原| 宁阳| 鸡泽| 中卫| 泰安| 富源| 绍兴县| 井研| 抚顺县| 泽库| 贵定| 沙县| 正阳| 郏县| 石棉| 夏津| 安宁| 辽宁| 龙岩| 凌源| 景东| 犍为| 南汇| 南木林| 陇县| 陆良| 雁山| 常德| 遂宁| 惠东| 泸定|

2019-05-21 19:05 来源:北京视窗

  

    公司总部日常有80余人上班,管理层成员为家族亲信,招收的员工也大多是老乡。”这位工作人员介绍,该广场外部还有一个停车场,车辆会经常进出,“通道也是为了给车辆司机一些‘警示’,消除安全隐患。

二是不要单独与网上认识的朋友会面。这背后的逻辑,解释了中国经济为何选择走这条高质量发展之路。

  第二天女子又说她爷爷到医院里面检查,得了肝血管瘤,需要一大笔钱做手术,还差3000元,她就通过微信以及电话联系郭某借钱,郭某信以为真就打了钱过去。  印度官员18日表示,当日凌晨1时左右,印度和巴基斯坦军队在印控克什米尔查谟地区发生小规模冲突,一名印度边境安全部队士兵和4名平民被打死,另有12人受伤。

    这是位于青岛市崂山区东海路上的上海合作组织青岛峰会新闻中心(6月3日无人机拍摄)。  站在高质量发展的新坐标上,过去的30多年,中国已经创造了一个高速增长的中国奇迹,今后的30多年,也一定能够再创造一个高质量发展的奇迹。

并“指导”办卡人按照固定的模板“照葫芦画瓢”地填写相关信息完事,导致很多人对违约责任根本不清楚,更不知道全额计息条款。

    例如,最近网上起底的“美女卖茶叶”套路,也让不少人中了招。

  消息引起热议,有人质疑此举是鼓励人们走路玩手机,有安全风险。  据了解,这条通道所在地位于西安一个咖啡创业主题街区内,该街区由百瑞未来城和西安市碑林区特色街区建设管理办公室合作建立,其中“低头族专用道”于4月下旬铺设完毕,目前已投用一个多月。

    这是位于青岛市崂山区东海路上的上海合作组织青岛峰会新闻中心(6月3日无人机拍摄)。

  2017年11月27日,女子又跟郭某说其爷爷在医院里又缺钱交医药费,郭某又给对方打了2000元。  中国青年报·中青在线记者樊未晨编辑:孙永政

  印方当天则表示,巴基斯坦军队当天凌晨袭击了印度边境部队和平民地区,造成平民死伤,印方随后回击了巴方的袭击。

  或许有人会认为这道题不像语文题,更像是历史题。

    伪装女性卖茶叶,转账之后就拉黑  这些团伙往往利用模特照片伪装成女性,通过设置虚拟定位,搜索“附近”的人广撒网“钓鱼”,添加微信好友后,与事主聊天;在取得事主信任并与事主成为男女朋友后,通过虚构家庭悲惨情况,以生日、失恋、家属住院及推销劣质红酒、茶叶或推荐事主通过虚假投资平台投资贵金属等方式骗取事主钱财。5月26日,民警在胡某家中将其抓获。

  

  

 
责编:

中共中央宣传部委托新华通讯社主办

半月谈

  • 中国搜索
  • 半月谈搜索

首 页 >> 资讯 >> 发现基层 >> 北京日报:语音识别距人类只差0. >> 阅读

北京日报:语音识别距人类只差0.4%?

2019-05-21 08:40 作者:姜姝姝 来源:北京日报 编辑:常磊
分享到:

  例如,最近网上起底的“美女卖茶叶”套路,也让不少人中了招。

日前,美国一家公司宣称专业速记员在记录对话时,转录词错率为5.1%,而该公司最新研发的语音识别系统词错率已达到5.5%,超越之前的历史最佳水平,树立了新的里程碑。语音识别,是人工智能领域的核心问题之一,0.4%的差距似乎意味着机器即将比肩人类。

 
    已过“甲子”之年
 
    斯坦福大学的相关研究者在2016年9月发布了一篇名为《2030年的人工智能与生活》的文章,提到:人工智能领域正式诞生于1956年夏天,一场由约翰·麦卡锡组织的在美国达特茅斯暑期研究项目的研讨会,在多年以后被认定为全球人工智能研究的起点。
 
    其实,对于人工智能子项目之一的语音识别来说,它的历史甚至比60年还要久。
 
    语音识别的研究源头可追溯至1950年,计算机科学之父阿兰·图灵在《思想》(Mind)杂志上发表了题为“计算的机器和智能”的论文,首次提出了机器智能的概念,论文还提出了一种验证机器是否有智能的方法:让人和机器进行交流,如果人无法判断自己交流的对象是人还是机器,就说明这个机器有智能了,这就是后来鼎鼎有名的人工智能图灵测试。
 
    图灵测试的概念极大影响了人工智能对于功能的定义,以此为途径,卡内基梅隆大学的两位科学家希尔伯特·西蒙和曼纽尔·布卢姆做了大量的前期工作,非常精妙地证明了罗素《数学原理》52道中的38道。西蒙甚至宣称在10年之内,机器就可以达到和人类智能一样的高度。
 
    在这一时期,科学家们也将语音识别比作“机器的听觉系统”,该技术可以让机器通过识别和理解,把语音信号转变为相应的文本或命令。1952年,贝尔研究所、Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年,英国的Denes等人研制了第一个计算机语音识别系统。
 
    从“模拟”人脑到开创统计方法
 
    当20世纪50年代明确了人工智能要模拟人类智慧这一大胆目标后,这一领域经历了近20年的辉煌。研究人员开展了一系列项目,表明计算机能够完成一系列原本只属于人类能力范畴之内的任务,例如证明定理、求解微积分、通过规划来响应命令、履行物理动作,甚至是模拟心理学家心理实验、作曲家谱曲这样的活动。
 
    但是,过分简单的算法以及计算能力的限制,严重阻碍了人们使用人工智能来解决更加困难和多样化的问题。
 
    这一阶段在人工智能的细分领域语音识别上,科学家们也走上了同样的弯路。他们认为,计算机要完成语音识别这类只有人才能做的事情,必须先让计算机理解自然语言,导致研究局限在人类学习语言的方式上了,即电脑模拟人脑,语言学者参与了大量的研究工作,但最后的成果却近乎为零。伴随着对未来继续努力的失望,人工智能包括语音识别都于20世纪70年代中期逐渐淡出公众视野。
 
    转机出现在统计语言学的创立上。这不得不提一个关键性人物——德里克·贾里尼克和他领导的IBM华生实验室,他们创新的使用统计方法,将当时的语音识别率从70%迅速提升到90%,同时语音识别的规模从几百个单词上升到几万个单词,使得语音识别就有了从实验室走向实际应用的可能。
 
    在贾里尼克之前,科学家们都把语音识别问题的核心归结为语言学中的规则问题,而贾里尼克将它当作通信问题后,用两个隐含马尔可夫模型(声学模型和语言模型)把语音识别重新概括清楚了。
 
    这个框架结构至今仍对语音识别影响深远,它不仅从根本上使得语音识别有使用的可能,而且奠定了今天自然语言处理的基础。贾里尼克后来也因此当选美国工程院院士,并被某杂志评为20世纪100名发明家之一。
 
    尽管贾里尼克在1972年就提出了新的研究范式,但模拟人脑与统计学的方法之争,却持续了近十五年时间,语音识别领域历经了十五年的新旧交替后,最大的成果其实是在技术的应用及产品化方面出现了进展。
 
    大进步的催化剂
 
    在互联网大爆发的20世纪90年代,人工智能的相关研究又一次停滞了。直到21世纪前10年,出现了一系列复兴人工智能研究进程的要素,尤其是下面这些重要的因素和核心技术:
 
    大数据。得益于互联网、社交媒体、移动设备和廉价的传感器,这个世界产生的数据量急剧增加。大数据是人工智能发展的助推剂,这是因为有些人工智能技术使用统计模型来进行数据的概率推算,如语音识别,通过数据的海洋中丰富的语料,使得技术不断优化。
 
    新算法。算法是解决一个设计程序或完成任务的路径方法。在一个完整的工业界语音识别系统里,最关键的是深度学习算法,还有很多工作是专业领域相关的算法,以及海量数据收集和工程系统架构的搭建。这些算法本身很重要,同时也是其他技术的推动者,比如机器学习算法Google的TensorFlow目前就被开源使用。
 
    可以说,任何技术都有蓄能阶段和爆发阶段,人工智能包括语音识别技术的爆发都得益于以上条件。这也不难理解,从语音识别来看,它是需要经验、数据和用户反馈共同作用来提升表现的。需要利用用户的反馈总结出一些特点。
 
    谷歌是最早在全球范围内大规模使用深度学习算法的公司,也最早开创了用互联网思维做语音识别。在这方面,科大讯飞受到谷歌的启发,迅速跟进成为国内第一个在商用系统里使用深度学习的公司。
 
    现有成绩和待解难题一样多
 
    语音识别技术已经发展了几十年,因为大数据和深度学习的应用,这一领域的传统强者成了谷歌、亚马逊、苹果和微软这些美国科技巨头,据统计,美国至少有26家公司在开发语音识别技术,而中国则有近50家公司研究这一领域。
 
    尽管谷歌这些巨头在语音识别技术上的技术积累和先发优势让后来者似乎难以望其项背,但因为一些政策和市场方面的原因,当然也有部分原因是中文的复杂程度高于英语,所以国际巨头的语音识别主要偏向于英语,中文领域的语音智能机会则留给了科大讯飞、百度、搜狗等中国公司。在国内,这些本土化产品更为用户所熟知。
 
    中文领域的识别难度在哪里?举个简单的例子,鲁迅《孔乙己》中的孔乙己之问:茴香豆的“茴”有几种写法?或者一个更有时代感的案例,如何形容物流很快?据说,在汉语里回答这个问题竟然至少有3600种说法,比如第二天就到了、物流很给力、给快递点赞等不尽其详。尽管语音识别在近些年来取得了巨大的进步,但其实仍然还有很多的工作要做。
 
    此外,还有确保语音识别能在更为真实生活的环境中良好地工作。这些环境包括具有很多背景噪声的地方,比如聚会场所或在高速路上驾驶的时候;还有在多人交谈环境中将不同的说话人区分开。
 
    还有一个更深层次的难题是,如果需要实现人机对话、人机写作,不只是需要用机器转录来自人类嘴巴的声音信号,更要理解人们所说的话。
 
    从语音识别来看,下一个前沿是从识别走向理解,真正的人工智能仍然还在遥远的地平线上,在机器能理解其所听到或看到的事物的真正含义之前,还需要很长时间的工作,有很长的路要走。
 
    或许也可以说,我们正在从一个人类必须理解计算机的世界,迈向一个计算机必须理解我们的世界。亚里士多德曾说过,如果机器能干很多活,岂不能让人类解放出来,或许这一解放的起点就是“理解”。(姜姝姝 作者为《机器人产业》杂志副总编辑)


版权声明:凡本网注明"来源:半月谈网"的所有作品,均为半月谈网合法拥有版权或有权使用的作品,任何报刊、网站等媒体或个人未经本网书面授权不得转载、 链接、转帖或以其他方式复制发布。违者本网将依法追究法律责任。如需授权,点击 获取授权

福泰隆广场 市七医院 浙江罗曼制衣公司 东太堡 镜上
石狮市边防大队 蓿亥图 承恩寺 互助路口 南湖大路