Microsoft, GitHub Copilot을 통한 오픈소스 불법복제로 고소 당함
(bleepingcomputer.com)- 개발자이자 변호사인 매튜 버터릭이 Microsoft, GitHub, OpenAI를 고소
- 오픈소스 라이센스 위반 및 프로그래머의 권리를 침해 했다고
- GPL, Apache, MIT 라이센스등은 저작자의 이름을 표시해야하는데, Copilot은 이를 무시함
심지어 150자 이상의 코드 스니펫이 그대로 복사됨에도 불구 - 일부 프로그래머는 이름 "오픈소스 세탁(laundering)"이라고 지적
- 소송을 대변하는 로펌에선 "Microsoft가 오픈소스 라이선스 및 기타 법적 요구사항의 조건을 무시하여, 다른 사람의 작업에서 이익을 얻고 있는 것으로 보입니다" 라고 얘기함
- 라이센스 위반과 별도로, 버터릭은 이 기능이 몇가지 다른 것들도 위반한다고 주장
- GitHub의 Terms of Service 와 Privacy Policies
- 저작권 관리 정보 삭제를 금지하는 DMCA 1202
- California Consumer Privacy Act
결국엔 open source license를 나눠서 학습데이터를 이용하고 copilot의 option에서 선택가능하게 하는 방식으로 해결되면 될듯하네요? - 라이센스 표기도 그에따라 정확하게생성하구요 이미그렇게 하고있나요? 제가 copilot을 언써봐서...
큰 이슈이긴 하지만, 해결 방법도 명확한것 같습니다.
이게 사람이 코딩할때도 문제가 많이 되잖아요? 가끔 회사에서 XXX 스펙에 대해서 open source 구현체 (예를 들어 Linux) 코드를 읽어보지 않은 사람 찾게될때가 있어요. (cleanroom 구현을 위해서) 가끔은 일하면서 무심코 리눅스코드 링크를 주면 뭐라고 할때도 있죠 - "나 그코드 읽으면 안되!". 때로는 내가 그 코드를 읽었었는지 기억이 안날때도 난감하죠.
이런, 사람이 겪는 문제보다 더 명확하게 해결될것 같습니다.
Copilot 발표 되었을때..
처음에 우와~ 하다가 몇일 뒤에 이런 라이센스 관련 이슈가 있어서.
잘못쓰다가 의도치 않게 회사 제품 코드 개발하는데 GPL 라이센스 코드가 뭉터기로 들어가면 큰 문제가 될 수 있다라는 의견을 봤는데...현실이 되었네요.
그대로 복사되는 것은 좀.. 그렇네요..
이래서 Explainable AI 쪽이 활발하게 논의가 되죠.. 왜 이런 결과가 나왔는지에 대한 설명을 할 수 있는 AI.
코파일럿이 이게 된다면 결과에 관여한 오픈소스코드를 주석으로 추가하는것으로 상당부분 논란을 피할 수 있을 것 같은데 말이죠..