2024-09-20 12:14:08|已浏览:35次
OpenAI上新啦!商业版ChatGPT单价骤减9成 推出语音转文字API 抛弃纸笔!讯飞iFLYBUDS Air耳机评测:录音文字轻松记录,
OpenAI上新啦!商业版ChatGPT单价骤减9成 推出语音转文字API
财联社3月2日讯(编辑 史正丞)当地时间周三(3月1日),OpenAI宣布正式推出面向商业用户的ChatGPT和Whisper语音转文字API,并给出了一系列商业伙伴已经上线的案例。
(来源:OpenAI)
简单来说,继去年11月向公众推出ChatGPT聊天机器人后,OpenAI现在开始向有意在自家APP或产品中提供相同AIGC服务的企业,提供付费接入的产品。公司介绍称,这次提供的API,基于ChatGPT同款的GPT 3.5模型。更为重要的是,在去年12月后,公司已经成功将ChatGPT的成本压低了90%。
因此,这款名为“gpt-3.5-turbo”的模型,定价为0.002美元/每1000 tokens。根据OpenAI官网的解释,token可以理解为一个一个非结构化的单词,而1000个token大概对应750个词。这个价格也要比目前的GPT 3.5模型便宜90%。
(来源:OpenAI)
截至发稿,已经有多款商业应用成为ChatGPT API的早期用户。图片和短视频社交平台Snap在本周推出了名为“My AI”的可定制化聊天机器人,供付费订阅用户使用。而拥有6000万学生用户的Quizlet在线学习平台,则提供能出题考验学生的家教机器人。许多中国零售业者出海卖货会用到的Shopify平台,也已经上线了聊天机器人导购。短短几个月内,ChatGPT迅速在全球软件生态中觅得自己的位置。
(来源:Shopify)
除了聊天机器人外,OpenAI也在周三拿出了商业化的语音转文字方案。公司最早在去年9月推出Whisper语音转文字模型,而今天则正式拿出了API接口供商业伙伴付费接入,定价为每分钟0.006美元。
根据公司介绍,Whisper API支持对语音文件进行转录和翻译,并支持包括英语、中文、阿拉伯语、日语、德语、西班牙语等几十种语言。
不过值得注意的是,OpenAI的产品说明文档中也显示,在业界常用的FLEURS数据集测试中,Whisper large-v2模型在识别英语、意大利语、德语时的单词错误率都能控制在5%以下,但识别中文的错误率达到14.7%,潜在的原因可能是训练数据中,中文语料的不足。
(来源:OpenAI)
OpenAI也警告称,由于人工智能会对语音进行“下一个词”的主动预测,所以生成的文本中可能会包含说话者实际上没说过的词。
抛弃纸笔!讯飞iFLYBUDS Air耳机评测:录音文字轻松记录
一、前言:会议纪要 你需要更智能的设备来解放双手
会议记录是当代初入职场的打工人必学的第一步,有了良好的记录习惯才能在职场中进步。
在智能科技尚未普及的年代,使用纸笔去记录会耗费相当长的时间,不仅记录效率不高,而且内容也不完整。
随着科技的日益革新,2023年,如何在会议中记录才能更高效呢?
答案当然是语音转录,一款耳机通过APP连接自动将语音输入的内容转换为文字形式,这就是最新的讯飞开放式办公耳机iFLYBUDS Air,当然,它不仅仅能录音转写,还是一款音质很好的气传导耳机。
1、TWS耳挂式、颈挂式双形态 一机多用 自由切换
讯飞开放式办公耳机iFLYBUDS Air的形态不同于其他耳机,而是将TWS耳挂式的形态与颈挂式形态二合一,组成了双形态的气传导耳机,并可在两种形态之间转换。如果想要更稳定更贴耳的佩戴,可以选择耳挂式,为了防止因剧烈运动而掉落,可以将耳机更换为颈挂式,我们可以根据需求,自由切换形态。
2、录音实时转写 解放双手
讯飞开放式办公耳机iFLYBUDS Air作为一款办公耳机,它不仅能够记录下会议上的音频内容,基于其强大的AI语音技术,还可实现实时录音转写。
在我们开会时,无需携带纸笔,只需要一款办公耳机,即可将所有会议内容全部转换为文字形式的会议纪要,方便我们回溯。
3、定制16.2mm超大喇叭 音质出色
作为一款耳机,音质一定不能差。
讯飞开放式办公耳机iFLYBUDS Air搭载定制的16.2mm超大喇叭,发声单元超普通耳机3倍。
其中线圈采用的是日本进口的由大黑原厂铜线绕制的无管音圈,配合高性能铷铁錋磁铁,在欣赏音乐时候三频更加均衡,中高音通透,低音浑厚,在最大程度上还原音乐的本质。
以下是讯飞开放式办公耳机iFLYBUDS Air的具体参数:
二、外观:TWS耳挂式与颈挂式两种形态 自由可变
讯飞开放式办公耳机iFLYBUDS Air的电池仓采用鹅卵石形态,砂岩白配色的表面辅以喷砂工艺,以极简的形态,整体的造型看上去时尚简约,亲肤的材质,摸上去极为舒适,开合处集成了柔光LED指示灯,可随时查看耳机的充电状态。
在电池仓开合的衔接部位,使用的是金属铰链,质感十足,下放是Type-C充电可口,正反盲插极为方便,左侧是重置按键,长按3秒配对,6秒重置。
打开电池仓,两颗耳机静静地躺在其中。
再取出耳机的那一刻,第一感受就是轻,单颗耳机仅有11.5g,轻便小巧的机身,佩戴时对耳部的贴合紧凑,进行高强度运动时也不会掉落。
两颗耳机均具备触控按键,通过长按、单击、连击等操作实现对音视频、录音功能的逻辑操控,在APP中也可以自定义触控逻辑,设置为适合自己的操控方式。
耳机内部采用了三颗金属充电触电,旁边的开孔则是16.2mm的超大发声单元。
讯飞办公耳机iFLYBUDS Air的发声原理与传统的骨传导耳机不同,它采用的是定向音频技术,通过空气定向震动传递声音,有效降低了对听小骨的刺激。
在耳机侧边配备了降噪麦克风,使用AI通话降噪,大大提升了语音转换的效率以及逆风通话的能力。
在两颗耳机的前侧面分别配备了独立的电源开关。
在包装盒内,附赠了耳机充电器,将两颗耳机磁吸后,通过Type-C数据线连接即可充电。
除了TWS耳挂式的佩戴方式,讯飞开放式办公耳机iFLYBUDS Air与符合人体工程学的记忆钛合钢丝耳机支架相连接,即可快速转换为颈挂佩戴方式,更适合日常办公、开会时使用。
三、APP体验:操控逻辑可自定义 实时状态与剩余电量看得见
讯飞开放式办公耳机iFLYBUDS Air的连接非常简单,在手机中下载iFLYBUDS APP,根据引导提示即可连接。
在连接耳机后,主界面直观的展示而来耳机常用的功能设置,包括设备连接管理、触控设置、游戏模式以及录音设置,在四大设置栏下面就是录音按钮,当我们在办公室开会,或者有需要记录视频中的音频内容时,讯飞开放式办公耳机iFLYBUDS Air可实现录音转文字。
作为TWS耳挂式与颈挂式二合一的办公耳机,对于智能手机中语音助手的适配那是相当广泛,不仅提供了对苹果手机中Siri的支持,还兼容了大多数主流安卓手机品牌对语音助手的唤醒,例如华为的小艺语音助手、小米的小爱同学、OPPO的小布语音助手,vivo的Jovi语音助手等。
市面上TWS蓝牙耳机所具备的游戏模式,讯飞开放式办公耳机iFLYBUDS Air也支持了,耳机支持的蓝牙5.3传输协议可以大幅度降低连接中的延迟,前提是需要连接设备也支持蓝牙5.3。
开启游戏模式,借助蓝牙5.3的低延时效果再进行优化,实现沉浸式超低延迟,游戏与视频过程中实现声画同步。
作为一款可以录音的办公耳机,结合科大讯飞未来智能强大的语音识别与转换的能力,在APP录音设置中不仅能够实现录音实时转文字的功能,还能够根据识别到的不同声纹对不同角色进行判断,并在文字转换界面自动标注。
这项功能极大地解决了在会议过程中多人说话记录混乱的情况。
在语音识别能力上,讯飞开放式办公耳机iFLYBUDS Air共支持9种语言、12种方言的语音识别。
同时,作为办公耳机,在各类行业领域术语的识别能力也要做到极致,讯飞开放式办公耳机iFLYBUDS Air支持金融、法律、科技、医疗、教育、电商等10大行业术语的识别翻译与转写,几乎囊括了各行各业,不管你在做什么类型的工作,总能找到适合你所在行业的名词翻译。
四、录音转写转译:精度与速度兼具 以实时字幕形态展现
在录音转写能力上,讯飞开放式办公耳机iFLYBUDS Air支持三种录音转写模式,分别为通话录音转写、音视频录音转写以及现场录音转写。
讯飞办公耳机iFLYBUDS Air支持的通话录音转写模式,专为在电话会议、线上沟通或远程采访等在通话录音方面有需求的用户而设计,当我们佩戴耳机时,点击录音按钮即可将电话或视频中录制到的音频内容实时转换为文字,包括了微信语音、腾讯会议、钉钉语言、飞书会议、讯飞听见、Zoom、Teams等语音及会议软件通话,转化的精确率高达98%。
除了常用的通话录音,讯飞开放式办公耳机iFLYBUDS Air还能够识别设备内置音视频中的声音并进行录音转写,在APP中我们可以开启这样的桌面悬浮窗,方便我们实时操作音视频内容。
我们也在B站中找了一段口播视频,APP通过悬浮窗的形式将录制的音频进行实时转换,可以看到转换的效率与精确度非常之高,文中几乎没有错别字,甚至还能够精准识别语气词、助词等词汇,并自动标注合适的标点符号。
当我们全屏观看视频时,讯飞开放式办公耳机iFLYBUDS Air在APP中的悬浮窗也会横置,并将文字以窗口形态的实时字幕展现,避免了因过宽的窗口遮挡住视频内容,这一点足以看出,科大讯飞未来智能在研发APP时,不仅在识别率与转换效率上做到了极致,还在软件的适配中下了大功夫,确实考虑到了用户的需求点。
接着,我们也测试了讯飞开放式办公耳机iFLYBUDS Air在转换大段文字时的精确度,也是相当之高,可以看到在这段文字中,几乎没有任何错别字。
在转换的文字中,我们手动点击任意文字内容,底部的音频进度也会随之跳转,在录制的会议与交流中,音画同步可以让我们回看的效率更高。
当然,我们也知道,机器识别的精度必定不如人,因此在识别框中也支持对文字的编辑操作,我们只需要选中识别有误的文字即可对内容进行更改操作。
另一项能力也是相当实用,耳机能够通过声纹识别,自动区分我方和对方,分不同的说话人来转换对应的文字内容。
记录下来的文字内容可实时翻译为其他语言,并且与说话的人相对应,逐行展现非常直观。
除了中文转换他国语言以外,如果录制的音频为英文,讯飞开放式办公耳机iFLYBUDS Air也支持将英文转换为中文,当出国旅游或公差时,耳机瞬间化身为翻译机。
五、音质与续航:三频表现亮眼 结合充电盒续航可达40小时
——音质
16.2mm的超大动圈单元,这要是放在TWS领域,可以算是行业老大了。
我们也测试了它的音质效果,在欣赏《渡口》与《第六感》等节奏感较强的音乐时,低音下潜到位,高音部分清脆明亮,虽然是非入耳式耳机,但整首歌听起来毫无粘滞,并且具层次分明,百听不腻。
——续航
我们在耳机满电时,将耳机的音量调至50%,佩戴耳机以正常音量欣赏30分钟音乐,在进行30分钟的录音转写,综合1小时的测试时长,耳机的电量仅消耗了3%,折算下来结合电池仓,续航大约可以达到近40小时。
当耳机处于颈挂形态充电时,双耳两侧的呼吸灯会连续慢闪,以表示耳机正在充电中。
而当耳机处于TWS模式时,直接放入电池仓中充电,此时充电仓的呼吸灯会以三种颜色闪烁,其中绿色代表电池仓剩余电量在80%以上,橙色表示电量在20-80%区间内,红色则表示电量在20%以内,我们也可以通过不同颜色的闪烁来判断电池仓的剩余电量,及时补电。
六、总结:办公娱乐两不误 当代职场人的必备利器
讯飞开放式办公耳机iFLYBUDS Air是一款非常有特色的产品,在形态上,既是颈挂式耳机,又是TWS耳机,两种形态也在适合更多的佩戴场景,在功能上,既是录音转文字的利器,又是不漏音的耳机,从办公到通勤,再到运动,几乎任何场景下都适合佩戴。
经过这段时间对讯飞开放式办公耳机iFLYBUDS Air的体验,我们对其作出以下总结:
1、双形态佩戴灵活
讯飞开放式办公耳机iFLYBUDS Air为我们提供了TWS与颈挂式两种佩戴方式,极大的满足了我们大部分的佩戴场合,会议时使用TWS式佩戴,更方便摘取,运动时使用颈挂式佩戴,防止耳机因剧烈运动而掉落,可以说是办公耳机的终极形态。
其次,得益于气传导的传播方式,耳机在佩戴时不需要入耳,长时间佩戴也不会对耳部造成伤害。
2、文字随录随转 快人一步
讯飞开放式办公耳机iFLYBUDS Air专为办公人士开发的语音实时转写功能,经过我们的测试,无论是音视频录音转写还是现场转写,其识别精度几乎可以达到98%以上,转写效率则几乎与音画同步,录制的话音刚落,文字便已转写完成。
3、音质通透 办公娱乐两不误
16.2mm的大动圈单元,给讯飞开放式办公耳机iFLYBUDS Air赋予了超过普通TWS耳机近3倍的音质表现,三频均衡,耳机所呈现的高音人声清脆明亮,低音效果比较有力量感,不会出现杂音或者破音的现象。
综合来说,讯飞iFLYBUDS Air作为一款办公耳机,有别于普通TWS耳机的最大之处,就是耳挂加颈挂的双形态,这也使得iFLYBUDS Air能够适应更多的使用场景,其次,多样性的实时转写功能,在办公时不仅是会议记录的利器,在娱乐时还能进行翻译,国外影音实时字幕真的别提有多方便了,定制的 16.2mm 超大动圈单元,也保证了耳机拥有出色的音质体验,因此,如果你是当代白领或者是初入职场的小白,讯飞开放式办公耳机iFLYBUDS Air可以说是必备的神器。
发布于:河南[db:内容]