谷歌于周一在 iOS 平台悄然发布了一款主打离线优先的语音听写应用「Google AI Edge Eloquent」,直接对标 Wispr Flow、SuperWhisper、Willow 等同类产品。
该应用可免费下载,在完成基于 Gemma 的自动语音识别(ASR)模型下载后,即可在手机上开始听写。应用内支持实时转录,暂停时还会自动过滤 “嗯”“啊” 等语气填充词,并对文本进行润色优化。
转录文本下方提供 “要点提炼”“正式化”“精简”“加长” 等选项,可一键转换文本风格。
用户还可关闭云模式,仅使用本地处理;开启云模式时,应用则会调用云端 Gemini 模型进行文本优化。如需使用,该应用还能从 Gmail 账号中导入特定关键词、姓名与专业术语,用户也可自行添加自定义词汇。
应用会记录历次听写会话历史,并支持全文检索;同时可显示上一轮听写内容、每分钟输入字数以及总听写字数。
谷歌在 App Store 应用介绍中写道:“Google AI Edge Eloquent 是一款高级语音听写应用,旨在打通自然口语与专业、可直接使用的文本之间的壁垒。不同于普通听写软件逐字记录卡顿与填充词,Eloquent 借助 AI 捕捉你想表达的核心含义,自动剔除‘嗯’‘呃’等语气词与语句中途的自我修正内容,输出整洁、精准的文本。”
该应用目前仅登陆 iOS 平台,但其应用商店介绍中已提及安卓版本。
据介绍,Eloquent 将提供 “无缝安卓集成”,可设为默认键盘,在系统任意文本输入框中全局使用;同时支持悬浮按钮功能,与 Wispr Flow 在安卓端的设计类似,可随时随地快速启动转录。
随着语音转文本模型不断优化,AI 驱动的转录应用正受到用户广泛欢迎。谷歌也通过这款实验性应用入局这一赛道,若测试顺利,未来安卓系统也有望迎来更完善的转录功能。