新着情報

You deserve to have all the best profession

GitHubのソースコードで学習したプログラミングAI「Copilot」は著作権侵害なのか?

2021/07/09 国際

ソフトウェア開発プラットフォームのGitHub20216月に、ソースコードを書くとその続きを補完する機能である「GitHub Copilot」をリリースしました。Microsoft傘下のGitHubが、ライセンスを問わずGitHub上のあらゆるソースコードを学習して作られたCopilotを商業利用することについて、「著作権的に問題があるのではないか?」との議論が巻き起こっています。

 

GitHubが、人工知能研究組織のOpenAIと協力してリリースしたCopilotは、途中まで記述したソースコードの「続き」を自動で補完する機能です。どのような機能なのかは、以下の記事に詳しくまとめられています。

 

「物議を醸した文章作成AIGPT-3よりはるかに優れている」との評もあるCopilotをめぐっては、「エンジニアを駆逐してしまうのか?」という議論もなされています。

 

そんな中、ソフトウェア開発者のNora Tindall氏はTwitterで、CopilotについてのGitHubとのやりとりを公開しました。GitHubへの問い合わせの中で「私のGitHubアカウントのコードはCopilotのトレーニングに使われましたか?」と尋ねたTindall氏に対し、GitHubは「GitHubで公開されているコードがすべてトレーニングに使われているようです。私たちはライセンスの種類でコードを区別しませんでした」と回答。これに対し、Tindall氏は「なんてことでしょう。彼らは文字通り恥を知りません」と非難しています。

 

GitHubがユーザーの著作権を尊重せず、コードを無断でAIの学習に使用したことに納得できないTindall氏は、「フリーソフトウェア財団電子フロンティア財団の法務部に連絡しました。集団訴訟への参加に興味のある方も連絡をお願いします。ひとりでは何もできません」と述べて、法的な措置も辞さない姿勢をあらわにしました。

 

GitHubとのやりとりを報告したTindall氏のツイートには、記事作成時点で4000件以上の「いいね」が寄せられています。また、ツイートが取り上げられたオンライン掲示板・Hacker Newsのスレッドには「学習データにGPLライセンスのコードが含まれているのなら、CopilotGPLに基づいて配布されるべきなのではないでしょうか。中には人間がコードを読んで勉強するのとどう違うのかという人もいますが、AIと人間とは大きく違います。人間はコピーして配布されるものではありません」というコメントや、「ツイートが注目を集める前は、プログラマーが短いコードをコピーすることに関心を寄せるのは弁護士や経営者だけでした。それが突然、誰もが著作権の最大化を主張するようになったのはどういう風の吹き回しですか?」といったコメントをはじめとする多数の書き込みが投稿され、議論が紛糾しました。

こうした議論について、欧州海賊党に所属する欧州議会議員であるジュリア・レダ氏は、「大企業、つまりGitHubの親会社であるMicrosoftがフリーソフトを分析して利益を得ようとしているのですから、著作権を使ってそれを阻止しようとするのはコピーレフトの擁護者にとっては当然のことだと思えるかもしれません」と述べて、コードの再配布や改変を認めるコピーレフトの考え方が大企業に利用されることへの拒否感に理解を示しています。

 

その一方で、レダ氏は「EUの著作権法では、GPLでライセンスされたコードやその他の著作物のスクレイピングは、ライセンスにかかわらず合法です。またアメリカでも、スクレイピングはフェアユースに該当します」と述べて、AIのトレーニングのためのコードをデータマイニングしても、著作権法に抵触するコピーには該当しないと指摘しました。またCopilotが生成するコードも、オリジナルのコードの独自性が認められるような性質のものではないため、著作権法で規定されている二次的著作物には当たらないと、レダ氏は結論づけました。

 

※本文章は『GIGAZINE』から転載されたものです。

經通國際智慧產權事務所

透過行動條碼加入LINE

開啟LINE應用程式,接著至「其他」頁籤
中的「加入好友」選單掃描行動條碼。