05.28
ChatGPTによる議事録生成(From音声データ編)
皆さんご存じのChatGPTは賢くて、いろんな事に使えます。文章の要約なんかはとても得意ですよね。
そんな機能を使って、会議の議事録を作ってくれないかなと、思うわけですよね。
いろんな方が作ったり、他のツールと混ぜて作ったりされています。
僕もチョット作ってみました。
現在のバージョンは1.5にしてあります。
方法はまだまだ他のツールを頼っています。
- ZOOMで会議をして録画する
- 録画データをAdobe PremiereProにかけて、文字起こしをしてもらう
この際、しゃべっている人を認識させて文字起こしを多人数として処理してもらうことを忘れない。 - 文字起こしした物をテキストに保存
- あとは、僕のツール(Webアプリ)に貼り付けて実行する
これで一応処理が行けます・
ポイントは今のところ、3時間くらいの会議のテキスト(160KB、3,500行)であれば処理できました。
ただし処理に30分程度かかります。
苦労したところ
ChatGPTは膨大なテキストを一度に処理できない。これは、ChatGPTで言うところのトークンと言っていますが、GPT4で2023年5月28日現在、4000トークンが一度に処理できる量です。1トークンが英語の1単語。日本語だと3トークンで1単語と言われています。GPT自身に聞いても明確には返ってきませんが、およそ3000単語以内のようです。
では、1行80文字程度の日本語の文章は何行で4000トークンになる?って聞いたところ。
したがって、80文字の行が平均的に40-50トークンと仮定すると、4000トークンは約80-100行になると考えられます。ただし、これはあくまで一般的な推定であり、実際の結果は文章の内容や文体によって異なる可能性があります。
と言うことだそうだ。
つまり今回僕がテストしたテキストだと、4000トークン35回分な訳です。ですから、これを一気に議事録作って!ってやると、エラーになるわけです。文字が多過ぎとなる。
そこで今回は、長文をチャンクに分けてトークンを超えない様にしながら、
<プロンプト>+<チャンクデータ>
<プロンプト>+<チャンクデータ>
<プロンプト>+<チャンクデータ>
<プロンプト>+<チャンクデータ>
を繰り返します。
そして最後に
<プロンプト>+<要約全体>
と言う方式にしました。これで長文もオッケーですが、どうやら要約全体が2時間くらいになると、それでもトークンの限界を超えてしまうので、次の課題となりますね。
コメント
この記事へのトラックバックはありません。
この記事へのコメントはありません。