IT之家 10 月 15 日消息,科技媒体 MSPoweruser 昨日(10 月 14 日)发布博文,报道称微软公司获得了一项新的专利,描述了基于用户实时输入的语音来生成图片。根据美国商标和专利局最新公示的清单,该专利共计 20 页,微软于 2023 年 4 月 5 日提交申请,于 10 月 10 日获批。根据专利描述,该系统可以在会议或讲座中实时捕捉音频,随后通过语言模型进行总结,并生成相应的 AI 图像。IT之家援引该媒体报道,该工作会分为 3 个步骤:捕捉音频:用户通过麦克风发言,系统实时记录并转化为文本。处理文本:分段记录文本,每段内容通过语言模型进行总结。生成图像:根据总结生成的提示,系统创建 AI 生成的图像,并在屏幕上实时显示。预计该功能将主要应用于 Microsoft Teams。随着演讲者话题的变化,实时生成的图像也会随之更新,从而增强视觉沟通的效果。微软表示,这种图像的使用有助于澄清概念,特别适合通过视觉辅
微软探索音生图 AI 模型,实时视觉化会议演讲者语音讲述的场景
2024-10-15 11:57:27来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 上汽与正泰电器在苏州成立新能源科技公司 注册资本约1.09亿2024-10-14 14:27:31
- 张纪中夫妇公司经营异常 张纪中夫妇名下一公司经营异常2024-10-14 14:26:26
- 喜临门在绍兴成立进出口公司 注册资本1000万2024-10-14 15:01:22
- 时尚博主gogoboi公司偷税被罚130万 gogoboi名下公司偷税被罚130万2024-10-14 15:24:36
- 吴文多任华润三九法定代表人 华润三九法定代表人变更2024-10-14 15:29:34
- 吴京起诉雪糕厂商获赔40万 雪糕厂商侵权吴京被判赔40万2024-10-14 15:29:12
- 吉利天津私募基金管理公司董事长变更 李东辉卸任2024-10-14 15:28:09
- 无忧传媒与桃花源旅投成立文旅发展公司 注册资本500万2024-10-14 15:57:29
- 佳源集团等被强制执行3.3亿2024-10-14 16:40:23
- 永聚煤业因重大火灾事故被罚1500万2024-10-14 17:00:16
- 12024易路全球人力资源峰会头部企业高管齐聚,引领AI生产力新浪潮
- 22.5G 网口 + 四核 N97 处理器:极空间 Z4 Pro 私有云 2159 元 3 期免息
- 3泰康拜博沈刚教授原创中国特色正畸技术,推动学术成果转化
- 4美股大型科技股盘前普涨,特斯拉、英伟达涨超1%
- 5微软将在一年后停止对Win10的支持
- 6DMSM 2024 峰会倒计时,议程已敲定
- 7零跑汽车在巴黎车展发布全新B系列及B系列首款全球化车型B10
- 8军工股探底回升,中航电测、北方长龙双双涨超10%
- 9哈萨克斯坦将主办GAMES OF THE FUTURE 2026
- 102K 240Hz,泰坦军团 P25M2S 24.5 英寸显示器 1379 元