商品情報にスキップ
1 1

thunder出版

aizuchi-dataset-part6

aizuchi-dataset-part6

通常価格 ¥8,500 JPY
通常価格 セール価格 ¥8,500 JPY
セール 売り切れ
税込。

100個の在庫

AiZuchi Part 6 — 日本語雑談音声コーパス(CD)

AiZuchi Part 6は、2人のネイティブスピーカーによる自然な日本語の雑談を収録した音声コーパスのCDです。台本なし・演技なし——素のままの会話をそのまま記録したプリミティブなデータセットです。

📀 収録内容

  • 2人の話者による雑談音声(FLAC形式)
  • 話者ごとに分離された個別コーパス(Speaker A / Speaker B)
  • ステレオミックス音声
  • タイムスタンプ付き書き起こし(JSONL形式)
  • 話者メタデータ

🎙️ データの特徴

  • プリミティブな生データ — 加工・編集を最小限に抑えた、素の雑談そのもの
  • 話者別分離済み — 各話者の音声が独立したコーパスとして提供されるため、即座にモデル学習に利用可能
  • 完全な許諾 — 全話者から商用利用を含む明示的な同意を取得済み
  • 物理メディア — CDでの納品。オフライン環境でも安心してご利用いただけます

📋 技術仕様

  • フォーマット: FLAC(ロスレス)
  • サンプルレート: 16 kHz / 16bit
  • 話者数: 2名
  • 言語: 日本語(ネイティブスピーカー)
  • メディア: CD

✅ ライセンス — ご購入で取得できる権利

  • ASR・TTS・対話モデル等、あらゆる機械学習モデルの学習に利用可能
  • 商用プロダクト・サービスへの組み込みOK
  • 基盤モデルのファインチューニングに利用可能
  • 学術研究・論文発表への利用OK

※ 生データの第三者への再配布・データセット自体の再販は禁止です。学習済みモデルの配布は自由です。


AiZuchi Part 1 — Japanese Casual Conversation Speech Corpus (CD)

AiZuchi Part 1 is a speech corpus CD containing natural, unscripted casual conversation (雑談) between two native Japanese speakers. No scripts, no acting — this is primitive, raw conversational data captured as-is.

📀 What's on the disc

  • Casual conversation audio between 2 speakers (FLAC format)
  • Per-speaker separated corpora (Speaker A / Speaker B)
  • Stereo mix audio
  • Time-aligned transcriptions (JSONL format)
  • Speaker metadata

🎙️ Data characteristics

  • Primitive raw data — Minimal processing. Authentic casual talk, recorded as-is
  • Speaker-separated — Each speaker's audio is provided as an independent corpus, ready for immediate model training
  • Fully licensed — Explicit consent obtained from all speakers, including commercial use
  • Physical media — Delivered on CD. Accessible in offline environments

📋 Specifications

  • Format: FLAC (lossless)
  • Sample rate: 16 kHz / 16-bit
  • Speakers: 2
  • Language: Japanese (native speakers)
  • Media: CD

✅ License — Rights you acquire with purchase

  • Train any ML model — ASR, TTS, dialogue, voice cloning, etc.
  • Deploy in commercial products and services
  • Fine-tune foundation models (open or proprietary)
  • Use for academic research and publication

※ Redistribution of raw data to third parties and resale of the dataset itself are prohibited. Models trained on this data may be freely distributed.

数量
詳細を表示する