AiZuchi
Japanese Casual Conversation Speech Corpus
日本語雑談音声コーパス「相槌」
Real conversations. Fully licensed.
AiZuchi is a Japanese casual conversation (雑談) speech dataset built from authentic two-person dialogues. Every recording is fully consented and cleared for commercial machine learning use — no legal gray areas, no attribution headaches.
Named after "相槌" — the Japanese art of responsive listening — this corpus captures the natural rhythm, backchannels, and spontaneous flow that make Japanese conversation unique. Each conversation is split into per-speaker corpora, giving you clean, separated audio tracks ready for model training.
Built for machine learning
Per-Speaker Separation
Each conversation is split into individual speaker corpora. Clean, isolated audio channels for each participant.
Full Transcription
Time-aligned transcripts with speaker IDs, turn indices, and conversation metadata in JSONL format.
Fully Licensed
All speakers have given explicit consent. Purchasers receive a commercial ML license with no usage restrictions on model training.
Natural Casual Speech
Authentic 雑談 — fillers, backchannels, laughter, overlaps. Not scripted, not read-aloud. Real conversation.
Organized per conversation, per speaker
Technical details
| FORMAT | FLAC (lossless) |
| SAMPLE RATE | 16 kHz / 16-bit |
| SPEAKERS | 2 per conversation |
| LANGUAGE | Japanese (native speakers) |
| STYLE | Unscripted casual conversation (雑談) |
| ANNOTATIONS | Transcription, timestamps, speaker ID, topic tags |
| CONSENT | Full explicit consent from all participants |
What you can do with AiZuchi
Commercial ML License
Who is this for?
AiZuchi is designed for teams building Japanese speech and dialogue systems. Whether you're training an ASR engine that handles casual speech, building a conversational TTS voice, developing a spoken dialogue model, or researching backchannels and turn-taking in Japanese — this is clean, licensed data you can ship with.
Common questions
本物の雑談。完全な許諾。
AiZuchi(相槌)は、2人の話者による日本語の自然な雑談を収録した音声データセットです。すべての録音データは話者本人から明示的な許諾を取得しており、機械学習への商用利用がクリアされています。法的なグレーゾーンや帰属表示の煩雑さは一切ありません。
「相槌」——日本語の会話に特有の応答的傾聴の技法——を名前に冠した本コーパスは、日本語の雑談が持つ自然なリズム、あいづち、フィラー、自発的な発話の流れを忠実に捉えています。各会話は話者ごとのコーパスに分離されており、モデル学習にすぐに使用できるクリーンな音声トラックを提供します。
機械学習のために設計
話者別分離
各会話は話者ごとのコーパスに分離。クリーンで独立した音声チャンネルを提供します。
完全な書き起こし
タイムスタンプ付きの書き起こし、話者ID、ターンインデックス、会話メタデータをJSONL形式で提供。
完全な許諾
全話者から明示的な同意を取得済み。購入者は商用機械学習ライセンスを取得し、モデル学習に制限なく利用可能です。
自然な雑談音声
本物の雑談——フィラー、あいづち、笑い声、発話の重なり。台本なし、朗読なし。リアルな会話そのものです。
会話ごと・話者ごとに整理
技術仕様
| フォーマット | FLAC(ロスレス) |
| サンプルレート | 16 kHz / 16bit |
| 話者数 | 1会話あたり2名 |
| 言語 | 日本語(ネイティブスピーカー) |
| スタイル | 台本なし自然雑談 |
| アノテーション | 書き起こし、タイムスタンプ、話者ID、トピックタグ |
| 許諾 | 全参加者から明示的同意取得済み |
AiZuchiで可能なこと
商用機械学習ライセンス
どのような方に最適か
AiZuchiは、日本語の音声・対話システムを構築するチームのために設計されています。カジュアルな発話に対応するASRエンジンの学習、会話型TTSボイスの構築、対話言語モデルの開発、日本語のあいづちやターンテイキングの研究——いずれの用途でも、このデータセットはクリーンで許諾済みの、プロダクションに使えるデータを提供します。
FAQ
Start building with real Japanese conversation
One purchase. Full commercial ML rights. No recurring fees.