Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发...
Verbatik是一款由人工智能驱动的文本到语音生成器,提供了一个不断增长的库,包含142种语言和口音的600多种自然声音。
Peech是一个为营销团队设计的生成式AI视频平台,允许他们快速轻松地创建高质量和吸引人的视频。它具有自动编辑过程、用于内容管理的智能库、自动生成的字幕、可定制的品牌元素、重...
Wisecut是一款在线自动视频编辑软件,它使用人工智能和语音识别来快速轻松地编辑视频。它会自动将长视频剪辑成更短、更有影响力的内容,并配有音乐、字幕和面部识别功能。它还使用...
Kimi 是由月之暗面科技有限公司开发的人工智能助手。它具备多语言对话能力,擅长中文和英文,能够处理长文本,支持文件阅读和网址解析,具备搜索能力,并且能够结合搜索结果为用户...
讯飞星火API提供强大的语音识别与自然语言处理功能,助力开发者快速构建智能应用。
捷通华声专注于提供先进的人工智能技术与服务,助力企业智能化转型与创新。
思必驰 DFM-2 大模型作为思必驰的自研对话式语言大模型,展现了其在多模态交互和行业应用中的潜力。它通过结合先进的AI技术,为用户提供了更加智能化和个性化的体验,推动了智能语...
网易见外是由网易人工智能事业部研发的AI智能语音转写听翻平台,提供视频听翻、直播听翻、语音转写、文档直翻等功能。
云知声山海大模型是一个多功能、跨领域的智能大模型,它通过集成丰富的知识库和先进的自然语言处理技术,为用户提供了一个强大的信息和知识服务平台。
LipDub语音翻译工具提供高效的实时语音转文字服务,帮助用户轻松实现多语言沟通和内容转录。
讯飞星火AI助手,高性能AI语言模型,具备多模态理解和生成能力,服务于企业服务、智能硬件、智慧政务、智慧金融、智慧生活和智慧医疗等多个领域。
探索百度翻译AI同传技术的核心功能与实际应用场景,了解其如何实现高效准确的实时翻译。
由阿里巴巴集团通义语音团队开发的框架,旨在增强人类与大型语言模型(LLMs)之间的自然语音交互
Peech 是一个强大的文本转语音工具,能够轻松地将文本转换成超过50种语言的逼真AI生成音频。
出门问问(Chumen Wenwen)是一家中国的人工智能公司,以其智能语音助手和相关技术而闻名。出门问问提供的OPEN API(开放应用程序编程接口)允许开发者将出门问问的技术集成到自己...
讯飞星火是科大讯飞推出的高性能AI语言模型,具备多模态理解和生成能力,服务于企业服务、智能硬件、智慧政务、智慧金融、智慧生活和智慧医疗等多个领域。
由 FishAudio 团队开发的开源、先进的多语言文本到语音(TTS)合成项目。它旨在通过结合大语言模型(LLM)技术,提供高质量、多语言的语音合成解决方案。
百小应是一款功能强大的智能助手,提供多种便捷服务,帮助用户高效处理日常事务。
一个为商业、团队和创作者设计的AI视频编辑工具,它通过提供快速编辑、多语言字幕、高级素材和团队协作等功能
一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。
音子AI利用人工智能技术提供了一系列便捷的音频处理服务,无论是音乐制作的音轨分离,还是有声读物的文本转语音,都能满足用户的不同需求。
有道智云引领创新,小采样数字人平台赋予虚拟形象生命 有道智云依托智能化趋势与个性化需求,倾力打造的小采样数字人平台,允许用户在该平台上创造自己的虚拟形象。
Beepbooply是一款人工智能驱动的文本转语音工具,允许用户快速轻松地生成具有逼真声音的音频内容。超过80种语言、120种口音和900种声音,用户可以自定义他们的音频,并生成几个小...