高精度のヒミツ|文字起こしAI AutoMemo(オートメモ)

文字起こし精度が、高い理由

「オートメモ」は、テキスト化の精度が高さ(文字変換の誤りが少ない)が特徴。
その理由として、次の2つが挙げられます。

AI翻訳機で蓄積した文字変換テクノロジー

100万台を突破し、翻訳精度の高さが評価されているAI通訳機 ポケトーク。その大きな要因が音声をテキストに変換する性能の高さです。ソースネクストが蓄積したAIによるテキスト文字認識テクノロジーとノウハウが「オートメモ」にも活きています。

ChatGPTで有名なOpenAI社のWhisperを採用

さらに「オートメモ」では、生成AIの先駆けとなったChatGPTの開発メーカー、OpenAI社の音声認識モデル"Whisper"を含むAIテクノロジーを採用。独自のチューニングにより、難しいと言われる日本語の変換の高精度を実現しています。

検証/文字起こし正解率 98.9% 

実際に「オートメモ」はどれくらい正確に音声を文字変換できるのか。本製品を使って録音、精度を検証しました。その結果98.9%の文字起こし正解率をマークしています。

文字起こし正解率 98.9%
環境音が約40dbの会議室で、話者と端末との距離が50cmで5名(うちリモート参加の2名はスピーカーからの距離)の会話をオートメモで録音して1回の検証をテキスト化。(ソースネクスト調べ/2023年8月)。精度は話し方や環境により大きく変わります。

文字起こし結果の例

実際に録音した音声と文字起こし、要約の結果をご確認いただけます。

 

オートメモは、業界最高水準

上の文字起こし正解率の比較表は、弊社内の会議を録音した音声・サンプル音声を文字起こしし、同条件で正解率を比べたものです。

要約も、高精度

「オートメモ」では、要約結果を人が作成した要約に近づけるため、AIが要約結果の評価、プロンプトの改善を行なっています。