[3日 トムソン・ロイター財団] – 米オープンAIが、マオリ語を含む数十種類の言語を英語に翻訳する音声認識ツール、「ウィスパー(Whisper)」を始動した時、ニュージーランド先住民の多くは警戒心を抱いた。
対話型人工知能(AI)「チャットGPT」を運営する同社が昨年9月に公開したウィスパーは、68万時間分のインターネット上の音声を学習しており、マオリ語についても1381時間分を学習した。
先住民の技術と文化の専門家は、こうしたツールは先住民言語の保護と復活に役立つ一方で、同意を得ずにデータを収集すれば悪用や先住民文化の歪曲(わいきょく)、少数民族の権利剥奪につながる恐れがあると指摘する。
マオリ族に属し、オークランド大学の倫理学者にして名誉研究員のカライチアナ・タイウル氏は「データはわれわれの土地であり、天然資源のようなものだ」と語り、「先住民族が自分たちのデータの主権を握れないなら、この情報社会の中であっさりと再植民地化されてしまうだろう」と警戒感を示した。
ロイターはオープンAIにコメントを要請したが、回答は得られなかった。
同社はウェブサイトに「AIシステムが信頼できる方法で開発されるよう、業界リーダーおよび政策立案者と」協力している、との文章を載せている。
ウィスパーのような生成AIは主にネット上で集めた大量のデータを学習し、文章や画像、動画などを生成するもので、教育から法律まで幅広い分野において急速に活用が進んでいる。
しかし、それと同時に盗作や非倫理的なデータ利用、文化盗用に関する懸念も広がってきた。
AI倫理学者で米先住民のマイケル・ランニング・ウルフ氏は、文化盗用に遭った長い歴史を持つ先住民族には、この懸念が特に当てはまると言う。
「われわれの言語データを集めて音声AIや大規模な言語モデルに活用することには、大いに商業的なインセンティブがある。一部の大規模データには、出典の説明がない先住民族のデータが含まれている」とウルフ氏は語った。
「先住民族のデータ主権は非常に重要だ。なぜなら神聖な、もしくは極めて機微に触れる、そして商業的価値があるかもしれない知識を、コミュニティーとして搾取から守ることにつながるからだ」という。
<偏見を拡散も>
多くの先住民族言語は絶滅の危機にあり、それに伴って文化や知識、伝統も消える恐れがあると国連は警鐘を鳴らしている。
マオリ族が復活を遂げているニュージーランドでは、政府が2040年までにマオリ語話者を100万人に増やす目標を掲げている。
マオリ語の放送を手がける非営利組織、テ・ヒク・メディアのピーター・ルカス・ジョーンズ最高経営責任者(CEO)は、これに伴いマオリ語を使ったデジタルシステムが増えていくと予想。「生成AIを使ったツールの開発は、先住民族の言語と文化の再活性化を間違いなく助けることができる」と話した。
しかし、マオリ族以外の組織がマオリ語を使った会話モデルを開発していることは「心配だ」とジョーンズ氏は言う。
「こうした大規模なAIモデルは、データに含まれるかもしれない偏りにほとんど関心を払わずにネットからデータをかき集めている。知的財産権に至っては、まったく配慮されていない」からだ。
ニュージーランド航空が2019年、マオリ語で「こんにちは」、もしくは「お元気で」を意味する「kia ora」という言葉のロゴを商標化しようとした際には、マオリ族の首長らの怒りを買い、外部の集団による言語および文化の吸収を巡る軋轢(あつれき)が浮き彫りになった。
先住民族は通常、生成AIの設計や試験に関わっていないため、アルゴリズムに偏りが埋め込まれているリスクを警戒する声がある。生成AIが不正確な情報を拡散する恐れも指摘されている。
タイウル氏は「生成技術が先住民族について虚偽の歴史や物語を伝えたり、偏見の創造と再創造を繰り返したりして、先住民族がデータ主権を取り戻せなくなる恐れが現実にある」と述べた。
<主権を取り戻す>
先住民族のデータと知識を保護する必要性については、徐々に認識が広がっている。しかし国が規制しても、データ主権は国境を越えて侵害される恐れがある。
またランニング・ウルフ氏によると、個人や企業はコミュニティーに対してデータ料を支払う法的義務がない。このため、「コミュニティーは提携相手を慎重に選んでいる。多くのコミュニティーから協力を断られた大企業も幾つかある」という。
テ・ヒク・メディアはマオリ語の音声認識モデルなどを開発中で、他のコミュニティーとも技術共有について協議している。ジョーンズCEOは、こうしたコミュニティーはデータの商業化を狙う複数の企業からの申し出を断ったと明かし、「結局のところ、(米アップルの音声認識アプリ)シリ(Siri)がマオリ語を話してよいかどうかを決めるのはマオリ族だ」と語った。
(Rina Chandran記者)