音声文字おこし屋さん by pessham
音声文字おこし屋さんキャラクター

貼るだけで、音声をサクッと
"文字おこし"

stand.fm の URL、mp3 / m4a などの音声ファイル、Discord 音声入力を
Whisper + GPT-4o が高精度に文字起こし & 3 行要約。
もう長い音声を聞き返す時間は要りません。

URLを貼って「もじ」とうつだけのデモ画面

📎 URLを貼って「もじ」とうつだけ

できること

stand.fm ワンクリック文字起こし

stand.fm ワンクリック文字起こし

エピソード URL を貼って もじ と送るだけ。

ファイルアップロード対応

ファイルアップロード対応

iPhoneのボイスメモなどからファイルアップロード対応。mp3 / wav / m4a ほか主要フォーマットを自動変換。

Discord ボイス録音入力

Discord ボイス録音入力

ボイスチャットで話した内容もそのままテキスト化(予定)。

開発中
📝

要約 + SNS 投稿文作成

要点を 3 行で整理、X (Twitter) 用テンプレも自動生成。
プロンプトはいつでも自由に変更可能

🔗

Obsidian 連携

Vault に Markdown 保存 & 類似メモリンク。

開発中

使い方は 3 ステップ

2

URL を貼る / 音声をアップロード

3

文字起こし & 要約を生成

料金プラン

FREE

¥ 0
  • 1 サーバー / 日 5 回
  • 音声 20 分まで
無料で導入

PLUS

¥ 490 /月
  • 回数無制限
  • 音声 20 分まで
  • 優先キュー & 高速化
PLUSを購入

購入・質問は @pess_ham まで DM

よくある質問

文字起こしの精度は?

OpenAI Whisper を使用しており、日本語でも高精度です。環境音や早口の場合は若干の誤認識が発生します。

どのような音声ファイルに対応していますか?

mp3、wav、m4a、mp4、avi、mov など主要なフォーマットに対応しています。stand.fm の URL も直接貼り付けるだけで文字起こしできます。

文字起こしにはどのくらい時間がかかりますか?

音声の長さにもよりますが、通常 1-3 分程度で完了します。有料プランでは優先処理により更に高速化されます。

音声データのプライバシーは大丈夫ですか?

処理完了後、音声データは自動的に削除されます。文字起こし結果のみが一時的に保存され、外部への共有は一切行いません。

Botが反応しない場合はどうすればいいですか?

「もじ」とだけ送信するか、Botにメンションを付けて送信してください。それでも反応しない場合は一度Botを再招待してください。

無料版と有料版の違いは何ですか?

無料版は1日5回まで、音声20分までの制限があります。有料版では回数無制限、PREMIUM プランでは音声60分まで対応し、優先処理で高速化されます。