微比恩 > 信息聚合 > 元脑生态伙伴马达智数助力信通院打通AI数据“任督二脉”

元脑生态伙伴马达智数助力信通院打通AI数据“任督二脉”

2022-03-29 14:08:00来源: 美通社

北京2022年3月29日 /美通社/ -- 马达智数与浪潮信息通过“元脑生态”合作,帮助中国信息通信研究院云计算和大数据研究所(以下简称“信通院云大所”)构建了AI数据集服务平台,实现AI数据的全流程管理与维护,可节省约80%的数据流转时间和60%的资源开销,使开发效率提升50%以上,有效降低用户使用难度,全面服务AI应用创新,助力AI应用的产业化落地。 数据之困 AI创新面临三重难题 信通院云大所希望能够构建一体化AI基础设施,解决AI数据从收集、整理、存储归档,到调用的全流程维护工作。在这一过程中,遇到了三大问题。 首先,要解决数据来源的问题。AI模型训练需要海量数据,以语音识别模型为例,要训练出能应对各种场景、语速、口音、口语等复杂情况的高准确度语音识别模型,至少需要1000个小时以上的训练数据,按每条数据平均4秒时长计算,数据量至少在90万条以上。文字识别OCR算法训练需要的图片数量则达到百万级别。如果仅

关注公众号
标签: AI