会議や打ち合わせのあと、「議事録を作るのが面倒……」と感じたことはありませんか。
最近はAIを使った文字起こしが注目されており、「ChatGPTで音声を文字起こしできないか」と考える人も増えています。しかし、実はChatGPTだけでは録音データをそのまま文字起こしすることはできません。
そこで本記事では、ChatGPTを活用した現実的な文字起こし方法をわかりやすく解説します。
あわせて、議事録作成に特に向いているAI文字起こしデバイス「Plaud Note」の特徴についても紹介するので、議事録作成の手間を減らしたい方は、ぜひ参考にしてみてください。
INDEX

まず前提として知っておきたいのが、ChatGPTに音声データをアップロードしても、文字起こしはできないという点です。
スマホやボイスレコーダーで録音したMP3やM4A、WAVなどの音声データをそのまま渡せば文字化してくれそう……と思いがちですが、現状(2026年1月時点)の仕様では残念ながら対応していません。

試しに、iPhoneのボイスメモアプリで録音した音声データを、ChatGPTにアップロードして文字起こしを頼んでみました。
結果、10分以上も考えた末に「ごめん」と言われてしまい……。やはり残念ながら音声データの文字起こしはできませんでした(2026年1月時点)。
ちなみに、ChatGPTの画面にあるマイクボタンをタップする音声入力機能を使うと、話した内容がリアルタイムでテキスト化されます。
ただし、この方法は、議事録作成には正直あまり向いていません。
理由としては、以下のような点が挙げられます。要するに、ChatGPTに話しかけて質問するための機能にとどまるからです。
そのため、ChatGPTで文字起こしや議事録を作成したい場合は、別の方法を組み合わせるのがおすすめです。
次の「ChatGPTで文字起こしする方法」では、現実的で使いやすい方法をいくつか紹介するので、参考にしてみてください。
結論としては、AIボイスレコーダー「Plaud Note」を利用する方法が手軽だと言えるでしょう。
レンタルプラットフォーム「SUUTA」では、「Plaud Note」を1か月4,200円、1日あたり約140円ほどでレンタル可能です。(※2026年1月時点の価格)
プラウド/Plaud Note
ここでは、専門知識がなくても使いやすい方法を中心に、文字起こしする方法を3つ紹介します。
| 方法 | 特徴 | メリット | デメリット | 向いている人・用途 |
| Whisperを使う | OpenAIの音声認識AIを、Colab等で動かして文字起こし | ・日本語の認識精度が高い ・無料で使える ・長時間音声にも対応しやすい |
・環境構築が必要で初心者は取っつきにくい ・標準機能だけでは話者分離ができない |
・コストをかけず高精度で起こしたい ・多少の設定作業ができる(または抵抗がない) |
| NotesGPTを使う | ブラウザで録音→文字起こし→(要約)まで一連で使える | ・録音〜文字起こし〜要約までツール内で完結 ・ブラウザから利用可能 ・文字起こしの精度が高い |
・標準機能だと要約が日本語非対応 ・話者分離に非対応 ・音声ファイルのアップロード不可 |
・環境構築なしで手早く試したい ・その場の録音メモを文字にしたい(会議の厳密な議事録より軽め用途) |
| Plaud Noteを使う | 録音専用デバイス+アプリで文字起こし・要約(話者別も対応) | ・録音デバイスなので音質が安定 ・話者別の文字起こしに対応 ・議事録向け要約が自動生成 ・操作がシンプルで使いやすい |
・デバイスが必要 ・購入だと初期費用がかかる |
・会議の議事録をラクに作りたい ・話者別+要約まで自動化したい ・ITが苦手でも簡単に運用したい |

出典:https://openai.com/ja-JP/index/whisper/
▼Whisperを使うメリット
▼Whisperを使うデメリット
Whisperは、ChatGPTで有名なOpenAIが公開している音声認識AIです。
精度が高く、日本語にも対応していることから、文字起こし用途でよく名前が挙がります。
ただし、ChatGPTのように単体のアプリとして動作するのではなく、別のプラットフォーム上で適切な環境を構築する必要があるので、難易度はやや高め。
以下では、無料かつ最もポピュラーなGoogle Colaboratoryを使ったWhisperでの文字起こし手順を紹介します。

まずは、Google Colaboratoryにアクセスしましょう。
「ノートブックを開く」という画面が表示されるので、左下の「ノートブックを新規作成」ボタンをクリックします。

コードを入力する画面が表示されるので、以下のコードをコピー&ペーストしてエンターキーを押しましょう。
!pip install git+https://github.com/openai/whisper.git
これでWhisperがインストールされます。

続いて、コード入力欄に以下のコマンドを入力してエンターキーを押しましょう。
import whisper
以上でWhisperを使用する準備が整いました。
実際に文字起こしをする場合は、音声ファイルをアップロードして、文字起こしを実行するためのコードを入力する必要があります。


画面左のメニューからフォルダアイコンを選択し、アップロードボタンをクリックして、文字起こししたい音声ファイルをアップロードしましょう。
続いて、以下のコードを入力してエンターキーを押すと、文字起こしが開始されます。
model = whisper.load_model(“base”)
result = model.transcribe(“ファイル名(アップロードしたファイル名)”)
print(result[“text”])
※コードをコピーする際の注意:サイトの表示仕様上、コード内の引用符(”)が全角(“”)で表示されている場合があります。 そのまま実行してエラーになる場合は、引用符を半角の(”)に書き直して実行してください。
画像では「2025-1130-定例.mp3」という名前の音声ファイルをアップロードしています。

出典:https://usenotesgpt.com/
▼NotesGPTを使うメリット
▼NotesGPTを使うデメリット
NotesGPTは、前述のWhisperを利用した文字起こしツールです。
Whisperが環境構築が必要だったのに対して、NotesGPTはブラウザからツールにログインするだけですぐに使えます。ITに苦手意識がある方でも気軽に使用できるのが魅力。
一方で、音声ファイルのアップロードには対応しておらず、その場で録音ボタンを押す使い方しかできない点がやや不便。また、話者分離もできないため、会議の議事録を作りたい場合は多少手間がかかってしまいます。

使い方は非常に簡単。まずはNotesGPTにアクセスして、ページ中央にある「Get Started」ボタンをクリックしましょう。
メールアドレスでアカウントを作成するか、Googleアカウントでログインが可能です。

ログインすると、画像のような画面に遷移します。
画面下にある「Record a New Voice Note」ボタンをクリックすると、新規音声データの録音を開始できます。

マイクボタンをクリックすると、録音が開始されます。
録音を終了したい場合は、再度マイクボタンをクリックするだけ。録音を終了すると、自動的に文字起こしがスタートします。

▼Plaud Noteを使うメリット
▼Plaud Noteを使うデメリット
Plaud Noteは、ChatGPTと連携して録音データを文字起こしできるボイスレコーダー。
ただ文字起こしするだけではなく、議事録やインタビューなど、用途にあわせた要約も可能です。
特に便利なのが、話者ごとに発言が整理される点。「誰が、何を言ったのか」が一目でわかるので、議事録作成の手間が大幅に減ります。
使う前に、スマホに専用のアプリをインストールしておきましょう。

Plaud NoteとスマホをBluetoothで接続すれば準備完了。

アプリの録音ボタン、またはPlaud Note本体のボタンを押すと、即座に録音を開始できます。


録音したデータを選択して「生成」ボタンをタップすると、文字起こしと要約が可能。
「会議議事録」や「授業ノート」など、要約用のテンプレートも用意されており、文字起こし後に何度でも好みのテンプレートを適用して要約できます。

また、音声のインポートに対応している点も魅力です。スマホのボイスレコーダー機能で録音した音声をアプリに取り込めば、同じように文字起こしと要約が可能。
Plaud Note本体を忘れてしまったり充電が切れてしまったりしても、録音データさえあればあとから簡単に文字起こしできます。
なお、Plaud Noteはレンタルが可能なため、「まずは試してみたい」という人にもおすすめ。短期間のプロジェクトや、月に数回しか会議がない場合でも、レンタルであれば気軽に使用感を確認できます。
プラウド/Plaud Note

ここまでいくつか方法を紹介してきましたが、議事録作成をメインの目的にするなら、Plaud Noteが一番バランスがいいと感じます。
理由はシンプルで、以下の3点が揃っているからです。
▼Plaud Noteの強み
ChatGPT単体や他ツールを組み合わせる方法は、どうしても工程が増えがちです。
その点、Plaud Noteは「会議に集中して、あとで確認するだけ」で済むのが大きな魅力と言えます。
プラウド/Plaud Note

ChatGPTでの文字起こしは便利な一方で、いくつか気をつけたい点もあります。
▼ChatGPTで文字起こしする際の注意点
ChatGPTで文字起こしする場合、元になる音声の質は結果に大きく影響します。
周囲の雑音が多かったり、話者との距離が遠かったりすると、AIは正しく音声を認識できません。特に会議室で複数人が同時に話す場面では、発言が混ざって誤変換が増えやすくなります。
議事録作成を前提にするなら、できるだけ静かな環境で録音し、全員の声を均等に拾える位置に録音デバイスを置くことが重要です。音質が安定していれば、後工程の修正作業も減り、結果的に作業時間の短縮につながります。

議事録には、社外秘の情報や個人情報、未公開の事業内容などが含まれることも少なくありません。ChatGPTを使って文字起こしや要約を行う場合は、入力した内容がAIの学習に利用されない設定になっているかを事前に確認しておくことが大切です。
ChatGPTや多くのChatGPTを利用した文字起こしツールには、会話データを学習に使わない設定をオンにする項目があります。業務で利用する場合は、この設定を必ず有効にしてから作業を始めましょう。
また、社内ルールや取引先との契約によっては、AIツール自体の使用が制限されているケースもあります。便利さだけで判断せず、情報管理の観点から安全に使える環境を整えておくと安心です。
AIによる文字起こしや要約は便利ですが、内容をそのまま鵜呑みにするのは避けたいところです。
固有名詞や専門用語、数字などは誤変換されやすく、議事録としてそのまま使うと致命的なミスにつながることもあります。
また、話の文脈をAIが誤って解釈し、意図と違う要約になるケースも少なくありません。
そのため、文字起こし後の文章は必ず人の目で確認し、必要に応じて修正しましょう。発言のニュアンスや重要な決定事項を正確に反映させることで、信頼性の高い議事録に仕上がります。AIはあくまで補助役として使う意識が大切です。
ChatGPTは知名度が高く、「文字起こし=ChatGPT」と思って調べる人も多いですが、文字起こしに対応したAIツールはほかにもたくさんあります。
▼その他の文字起こしができるAIツール

出典:https://line-works.com/ainote/
| 名称 | LINE WORKS AiNote |
| ツールの位置づけ | AI議事録・文字起こしツール (録音→文字起こし→話者分離→AI要約→共有までを想定) |
| 向いている利用者 | 法人〜チーム利用がメイン(管理・監査ログ等の管理機能あり) 一方で個人利用も可能(ただしLINE WORKSプラットフォームの開設が必要) |
| 対応デバイス | iOS / Androidアプリあり |
| 主要機能 | 文字起こし/話者分離/AI要約/よく使う単語登録/ノート共有/複数言語(日・英・中・韓)など |
| Web会議録音 | 機能として Zoom / Microsoft Teams / Webex / Google Meet / LINE WORKS |
| 管理・セキュリティ | メンバー・組織管理、機能制限、統計、監査/ログ、2段階認証、SSO等の記載あり(法人運用向け) |
| 無料トライアル | 30日間 ただし対象はチーム/ビジネス(公式ページ表記) |
| データの学習利用 | フリーは「学習利用あり」、有償は「学習利用なし」 |
| データ保管期間 | フリー:1年 ソロ:3年 企業向け:5年(公式の料金表記載) |
LINE WORKS AiNoteは、ビジネス向けコミュニケーションツール「LINE WORKS」から生まれた、議事録作成に特化したAI文字起こしサービスです。
会議の音声を録音するだけで、自動的に文字起こしと要約を行ってくれるため、議事録作成の手間を大きく減らせます。
話者の切り替わりを認識しやすく、会議の流れを把握しやすい点も特徴です。また、LINE WORKSのサービスとして提供されていることから、セキュリティ面を重視する企業でも導入しやすい設計になっています。
一方で、利用にはLINE WORKS環境が前提となるため、個人利用やスポット的な文字起こしにはややハードルが高い面もあります。社内会議や定例ミーティングが多い企業向けの選択肢といえるでしょう。

出典:https://www.notta.ai/
| 製品名 | Notta |
| ツールの位置づけ | AI文字起こし・議事録支援 (録音/Web会議/音声・動画ファイルから文字起こし、要約など) |
| 個人向け or 法人向け | 個人向け(プレミアム)〜小規模チーム(ビジネス)〜大規模導入(エンタープライズ)まで段階的に用意 |
| 主な利用シーン | 会議、商談、インタビュー、オンライン会議の記録、録音データのテキスト化 |
| 入力方法 | リアルタイム録音 / 音声・動画ファイルのインポート / Web会議の文字起こし(Zoom・Google Meet・Teams・Webex 等) |
| 話者分離(話者識別) | 最大10名まで識別に対応(録音方法・言語条件により動作条件あり) |
| AI要約 | プランごとに月回数の上限あり(フリーでも回数つきで利用可) |
| 対応言語 | 音声認識は58言語に対応 |
| 連続文字起こし上限 | フリーは1回3分 有料は1回最大5時間(プラン表記) |
Nottaは、日本語対応に強いAI文字起こしサービスとして知られており、会議やインタビュー、打ち合わせの議事録作成に幅広く使われています。
スマホアプリやWebブラウザから利用でき、音声ファイルのアップロードだけで文字起こしが完了する手軽さが特徴です。
また、話者分離や要約機能も備えており、文字起こし後の整理作業を効率化しやすい点も魅力。一方で、長時間の利用や高度な機能を使う場合は有料プランが必要になります。
個人から法人まで幅広く使える、バランスの取れた文字起こしAIといえるでしょう。

最近は、Galaxy AIのようにスマートフォン本体に標準搭載されたAI機能で、文字起こしや要約ができる機種も増えています。
専用アプリを追加でインストールしなくても使えるため、思い立ったときにすぐ録音・文字起こしができる手軽さが魅力です。
録音と同時にテキスト化できる機能や、簡易的な要約に対応している場合もあり、打ち合わせ内容をサッと振り返りたいときには便利でしょう。
ただし、機種やOSによって使える機能に差があり、話者分離や議事録向けの細かい整理までは対応していないケースもあります。簡易メモ用途には向いていますが、正式な議事録作成には専用ツールとの併用がおすすめです。

ChatGPTだけで文字起こしを完結させるのは難しいですが、ツールをうまく組み合わせれば、議事録作成はかなりラクになります。
なかでも、録音から要約まで任せたいなら「Plaud Note」や「Plaud NotePin」は魅力的です。
業務で使えるレベルか、使い方は難しくないのかなど気になる点が多い方は、レンタルで実際の使用感を試してみてください。