"中国のAI業界で働く中国国内の人々も、LLM(大規模言語モデル)訓練用の中国語テキストデータセットに、質の高いデータが不足していることを認める。理由の1つは、中国のインターネットがかつて、そして概して今も、テンセント(Tencent)やバイトダンス(ByteDance)といった大企業によって分割支配されているからだ" https://www.technologyreview.jp/s/337128/openais-latest-blunder-shows-the-challenges-facing-chinese-ai-models/