近年来,“居家办公”全球化和常态化的趋势愈发明显。工作时间,人们使用网络会议、视频通话、直播电商等实时互动应用的机会越来越多。工作之外,人们普遍缩小了活动半径、减少了外出频次,纷纷将聚会、约见等线下活动搬到了线上。接近全场景的线上互动需求,让“实时互动体验”成为了几乎所有企业和用户共同关注的焦点。
谁能提供“线上的沟通,线下的互动体验”,谁就有机会成为下一届的互联网话事人。这个观点,让很多创业者仿佛看到了新的风口,短时间内,基于“实时互动”的大量创业公司集中涌现。但创业并不像很多人想象的那么简单,资金问题、人员问题、技术问题、上下游问题……这让很多创业者忙得焦头烂额,大大影响了产研速度和成功几率。
为了帮助实时互动领域的创业者,微软与声网深度融合,技术上,双方共同推出了语音转文字插件“微软实时语音识别”,帮助开发者用几行代码,就可以快速地和声网的 RTC 进行集成。生态上,微软为声网的“超音速计划“中的创业企业提供了云技术服务优惠权益,以求通过技术与生态的双融合,帮助创业者以更低成本挖掘创新场景解决方案,为实现产品和技术创新提供更多可能。
微软实时语音识别,是微软和声网联合发布的语音转文字功能插件,是两者整合了各自的优势技术和服务,共同为实时互动创业者打造的优质场景解决方案。使用该插件,可以有效地帮助创业者减少研发周期、提升开发效率。
微软实时语音识别,可将音频流实时听录为文本。应用程序、工具或设备可以使用、显示和处理此文本即命令输入。此功能使用 Microsoft 用于 Cortana 和 Office 产品的同一识别技术。它可与语音服务的翻译和文本转语音产品/服务无缝地协同工作。
微软实时语音识别,广泛地适用于需要将语音信息转化为文字信息进行存储和分析的业务场景,例如电话客服、会议纪要等;也可以结合其它AI服务,高度融合于新兴的智能化服务和应用场景,如虚拟助手、对话机器人等。
微软语音转文字,支持超过 100+ 语种,包括众多小语种。覆盖全球 60+ 数据中心,无论是全球同服还是分区分服,在 AI 领域,微软的数据合规、安全、服务稳定性、性能优化、成本性价比等方面均属首屈一指。目前,微软正在跟声网积极探讨更多的合作机会,例如翻译、内容审查等,期待为声网云市场或其他合作伙伴提供最前沿的 AI 技术。
超音速计划,是声网生态面向实时互动初创企业启动的一项创业加速计划,携手了以微软为代表的多方生态合作伙伴帮助实时互动领域的创业企业以更低成本、更高效地实现创新创业。超音速计划的成员企业,可以获得创业课程、生态产品免费套餐包、技术支持、投资咨询等资源扶持。