よくある質問
ログインができない場合は、どうすればよいですか?
ユーザー名とパスワードを入力する前に「ログイン状態を保持する」の項目をクリックしてください。それでもログインできな場合は、キャッシュとCookieの削除を行ってみてください。
主なブラウザのガイド:
それでも解決しない場合は、Tatoebaチームにメール (team@tatoeba.org) でお知らせください。その際は、お使いのブラウザとその他の重要と思われる事項をできるだけ詳細にご記入ください。
一部の翻訳がグレー表示されるのは、なぜですか?
グレーの翻訳は、間接翻訳です。つまり、それらは翻訳された文をさらに翻訳したものであり、原文(大きな文字の文)の翻訳ではありません。
Tatoebaでは、間接翻訳が役立つと考え表示していますが、原文とは少し違う意味を含んでいる場合があるので、ご注意ください。
原文に対し、いくつかの翻訳があると思う場合は、全ての翻訳を追加した方がよいですか?
それは、活動される方の判断にお任せしています。
1つの翻訳が他の翻訳より日常的に使われていると思われる場合は、その翻訳のみを追加してください。複数の翻訳を追加することが有意義だと思う場合は、可能と思う全ての翻訳を追加することもできます。
全ての翻訳が有意義だとは思うけど、毎回全てを追加するのは大変だと思う場合(きっとそう思うでしょう)は、ランダムまたは個人の好みに基づいて、追加する翻訳を選んでください。
Tatoebaでは、全ての例文に、全ての可能な翻訳が必要というわけはなく、コーパス全体が可能な限りさまざまな方法をカバーしているという事が重要だと考えています。
例えば、"you"という単語を持つ英文があったとします。この単語は他の言語に様々な方法で翻訳することができます。分かりやすく説明すると、"you"を翻訳する時、私たちは単数形「あなた」と複数形「あなた達」の2つの訳が思い浮かぶと思います。この場合、Tatoebaでは、少なくとも1つの例文が単数形「あなた」で翻訳され、少なくとも1つの例文が複数形「あなた達」で翻訳されることを確認できればいいのです。よって、もし単数形「あなた」で翻訳した人がいないことに気が付いた場合は、単数形「あなた」を使った例文を追加してください(複数形の場合も同様です)。また、1つの例文のグループが他の例文のグループと比べ、充実していないと感じる時は、そのグループの翻訳を優先してお互いのバランスをとることもできます。
あってもいいはずの言語の翻訳が見つからないのは、どうしてですか?
Tatoebaは、「設定」ページで表示する言語コードを指定している場合は、指定した言語の翻訳だけを表示します。全ての言語の翻訳を表示したい場合は、この項目を空欄にしてください。
赤字の例文は何を意味しますか?
赤字の例文は、Tatoebaで承認されていない例文です。著作権上問題があったり、他の問題を含んでいます。
翻訳しないでください。
例文が正しい言語で登録されていません。どうすれば直すことができますか?
古いインターフェイスデザインを利用している場合は、例文の左側にある<言語>アイコン(通常は旗)をクリックし、ドロップダウンリストから正しい言語を選択してください。新しいインターフェイスデザインを利用している場合は、<編集>アイコン(ペン)をクリックし、古いインターフェイスデザインと同様に正しい言語に変更してください。お使いのインターフェイスが古いものなのか新しいものなのかがよくわからない場合は、「設定」ページに移動し、「新しいデザインを有効にする」の左側のチェックを確認してください。新しいインターフェイスの場合は、オン - 緑色で表示されます。
例文にタグを追加するには、どうすればよいですか?
タグを追加できるのは上級ユーザーからになります。
=> 次の項目をご覧ください:上級ユーザーになるためには
新しい言語をリクエストするには、どうすればよいですか?
=> 次の項目をご覧ください:新しい言語をリクエストする
中国語で投稿する場合は、簡体字と繁体字のどちらを使えばよいですか?
どちらでもお使いいただけます。Tatoebaでは簡体字は繁体字に、繁体字は簡体字に自動変換します。
[設定]画面で[新しいデザインを有効にする]にチェックがない場合は、例文を閲覧中に、中国語の例文に差し掛かると、文の先頭に次のアイコンが付いた文が表示されます。
- 繁体字
- 簡体字
[新しいデザインを有効にする]にチェックがある場合は、(↳)が表示されます。
それぞれの中国語の例文の下には、簡体字または繁体字に変換された代替表記とトランスクリプションのピンインも一緒に表示されるようになっています。
中国語の例文をご覧になってみてください。
アカウントを削除するには、どうすればよいですか?
=> 次の項目をご覧ください:アカウントを削除する方法
Tatoebaは、APIを提供していますか?
いいえ、(まだ)していません。
残念ながら、Tatoebaでは公開APIを提供するためのインフラストラクチャがありません。とはいえ、ご関心をお持ちのようであれば、お気軽にお問い合わせください。
多くの方からの問い合わせがあった場合、それがTatoebaにとって新たな開発の手掛かりになります。是非、あなた方のアプリケーション/プロジェクトのニーズについて詳細をお聞かせください。
なお、現段階では、ダウンロードページから例文をダウンロードし、独自のAPIを構築いただくことが可能です。
Tatoebaのデータをプロジェクトで利用したいのですが、著作権法における帰属(以下「著作権表示」と記す)方法を教えてください。
テキストデータの場合
基本的には、https://tatoeba.orgへのリンクを張り、例文の一部または全てがTatoebaから出典されたものであること、TatoebaのデータがCC-BY 2.0 FRで提供されていることを明記する必要があります。
適切な著作権表示の例: https://www.clozemaster.com/about#where-are-the-sentences-from
音声データの場合
Tatoebaの音声コーパスには、さまざまなライセンスがあり、CC-BY だけに限定されていません。そのため、特にプロジェクト/アプリケーションが営利目的および商用利用の場合は、使用する音声に充分注意してください。
各音声のライセンスは、ダウンロードページの「音声つきの例文」で提供しているファイルで確認することができます。
音声を再利用している各メンバーのユーザー名とメンバーが選択したライセンスを記載することをお勧めします。
著作権表示の例:
All the audio comes from Tatoeba (https://tatoeba.org), more specifically from the following members of Tatoeba:
- userA (license: CC-BY-SA)
- userB (license: CC-BY-NC)
- userC (license: CC-BY)
Tatoeba の音声データはどこからダウンロードできますか?
現在、音声ファイルのダウンロードは、各音声ファイルを1つずつフェッチする方法のみ提供しています。全ての音声を含む1つの大きなZIPファイルはありません。
ただ唯一、Tatoebaは、Common Voiceプロジェクトからの依頼により、2017年11月に3.8GBの英文用のファイルtatoeba_audio_eng.zipを生成し、現在もCommon VoiceプロジェクトのDatasets のページにあることも併せてご紹介させていただきたいと思います。
最新の音声や他の言語をご希望の場合は、ダウンロードページの音声ファイルをダウンロードして、スクリプトを作成する必要があります。具体的な手順は、以下の通りです。
- 「音声つきの例文」:音声つきの全ての例文のID(id) を取得する。
- 「例文」:各例文の言語(lang)を確認する。
音声ファイルをダウンロードするためのURL:
https://audio.tatoeba.org/sentences/{lang}/{id}.mp3
例: https://audio.tatoeba.org/sentences/eng/7347611.mp3
注:このデータをプロジェクト/アプリケーションなどでご利用になられる際は、ライセンスに注意してください!
特定の言語の全ての例文と翻訳をダウンロードするには、どうすればよいですか?
ダウンロードページから、「例文」の「すべての言語」または「次の言語の例文のみ」をダウンロードできます。なお、コーディングに詳しい方であれば、全ての例文の翻訳リンクもお役に立つと思いますので、ダウンロードしてご利用ください。
ManyThings.orgのサイトには、Tatoeba のメンバーがコンパイルした英文と他の言語への翻訳のセットがあります。
Python に詳しい場合は、GitHubのTatoeba Playgroundプロジェクトを使用して、指定した条件を満たす例文と翻訳を取得できます。
また、必要な処理を既に実行しているスクリプトも検索できます。これらのスクリプトを検索するためのGoogle検索の例をいくつかご紹介します。
さらに、TatoebaのGoogle グループもご覧ください。共有したいスクリプトがある場合は、このスレッドにお気軽にご返信ください。