语言识别模型源于一个数学家读小说的故事。1913 年,俄罗斯数学家安德雷 · 安德耶维齐 · 马尔科夫拿起一本俄罗斯文学的经典作品,亚历山大 · 普希金的歌剧小说《尤金 · 奥涅金》。不过马尔科夫只是为了测试自 1909 年发展起来的概率论。数学家更想看到一个个字母后面的数学结构。那时的概率论主要用来分析轮盘赌局和硬币翻转等现象,认为之前的结果不会影响到的当前事件的可能性。但是马尔科夫不赞同,他觉得大多数事情都有因果关系,他想要通过概率分析一些事情,并建立模型。德雷 · 安德耶维齐 · 马尔科夫《尤金 · 奥涅金》成为马尔科夫的试验材料。他的假设听上去匪夷所思——这本经典文学作品中,某个位置会出现什么字母,某种程度上取决于它之前的字母。计算机还没出现的 1913,马尔科夫抄录了《尤金 · 奥涅金》书中的前 20000 个字母,不包括标点和空格。然后按 10*10 的排列方式,填在 200 个网格中,开始逐行逐列对元音字母进行计数
语言识别模型的起源,一个数学家数了数小说中的 20000 字母
2020-08-14 09:10:01来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 蔚来重拾自动驾驶自研:海外VP离职,原Momenta研发总监任少卿接棒2020-08-14 09:19:41
- 香港恒生指数今日低开0.63%,腾讯控股跌1.47%2020-08-14 09:21:53
- 36氪独家 | 蔚来重拾自动驾驶自研:海外VP离职,原Momenta研发总监任少卿接…2020-08-14 09:15:44
- 继苹果后,Epic再起诉谷歌下架《堡垒之夜》违反反垄断法2020-08-14 09:21:45
- 国产PD-1适应症“追逐”,恒瑞卡瑞利珠单抗临床获新进展2020-08-14 09:22:31
- 国美任命向海龙为线上平台CEO;丁磊将在抖音直播带货首秀;Shake Shack来北…2020-08-14 08:54:00
- 阅文的结构性矛盾,是资本逻辑和创造逻辑2020-08-14 08:57:13
- 50%“行业生命线”开放背后,线下文娱市场复苏迎加速2020-08-14 09:05:15
- 腾讯微博起诉新浪微博商标近似 法院一审:不构成近似商标2020-08-14 09:01:15
- 《无绳吸尘器选购指南》发布 全方位解锁你的专属吸尘器核心知识点2020-08-14 09:00:00
- 1京东方A:拟增资北电集成用于建设12英寸集成电路生产线项目
- 2阿里CEO吴泳铭:双11 GMV强劲增长,核心用户留存和新用户增长取得突破
- 38999 元,微星旗舰 AMD 主板 MEG X870E GODLIKE 上市
- 4蚂蚁集团:第二财季净利润75.9亿元,同比增长193%
- 5工信部等四部门:到2026年新制定锂电池产业国家标准和行业标准100项以上
- 6华嵘控股:筹划控制权变更事项,股票11月18日停牌
- 7深圳上市公司并购重组年内完成交易总值居全国第二
- 8三星 Galaxy A26 手机外观 / 规格曝光:水滴屏 + “超频版”Exynos 1280 处理器
- 9试点启用“刷脸”通关,往来港澳 11 月 20 日起“免出示证件”
- 10劳资谈判未取得进展,加拿大邮政工人工会宣布罢工