2024年10月微软开放智能应用：可通过语音识别用户

更新时间：2024-10-29

　　微软早些时候宣布了一个Project Oxford的计划，它可以帮助开发者创建可以语音识别的智能应用，通过微软内部的算法，给用户提供更智能的解决方案和服务。

　　11月12日微软开放了表情识别、拼写检查等智能API，并承诺将在年内推出语音识别/视频等新API预览，今天微软兑现承诺。微软对这两项API的描述为：

　　“语音识别API将提供通过语音识别用户的技能，不过这项功能并不能取代指纹和虹膜等强类型身份认证方式，可作为辅助认证方式来提升安全性。这项功能还可用于提升客服体验，通过客户声音自动识别客户，不必再通过询问确定客户身份。”

　　“视频API使得视频的分析和编辑变得更加简单，还可以使用微软的视频处理算法检测视频中的人脸，通过稳定背景的方式检测运动状态，以平滑和稳定视频。

　　微软开放智能应用，语音识别只是这些应用功能的一部分。通过Project Oxford可以自动生成更智能的应用，对开发者来说也是非常方便的。

您可能感兴趣的文章:

相关文章