QuinTech

Vào tháng 5, OpenAI tuyên bố đang phát triển một công cụ cho phép các nhà sáng tạo chỉ định cách tác phẩm của họ được sử dụng – hoặc loại trừ – khỏi dữ liệu huấn luyện AI. Tuy nhiên, sau 7 tháng, tính năng này vẫn chưa ra mắt.

Công cụ này có tên là Media Manager, được OpenAI mô tả là có khả năng “xác định văn bản, hình ảnh, âm thanh và video có bản quyền,” nhằm phản ánh tùy chọn của các nhà sáng tạo “trên nhiều nguồn khác nhau.” Mục đích của nó là giảm bớt sự chỉ trích gay gắt từ một số đối tượng và có thể giúp OpenAI tránh được các thách thức pháp lý liên quan đến quyền sở hữu trí tuệ.

Tuy nhiên, theo nguồn tin từ TechCrunch, công cụ này hiếm khi được xem là một dự án quan trọng nội bộ. “Tôi không nghĩ rằng nó là ưu tiên,” một cựu nhân viên của OpenAI cho biết. “Thành thật mà nói, tôi không nhớ có ai thực sự làm việc với nó.”

Một người không phải nhân viên nhưng phối hợp công việc với công ty nói với TechCrunch vào tháng 12 rằng họ đã thảo luận về công cụ này với OpenAI trong quá khứ, nhưng không có bất kỳ cập nhật mới nào gần đây. (Những người này từ chối công khai danh tính vì các vấn đề kinh doanh bảo mật.)

Ngoài ra, một thành viên trong nhóm pháp lý của OpenAI từng làm việc với Media Manager, Fred von Lohmann, đã chuyển sang vai trò tư vấn bán thời gian vào tháng 10. OpenAI cũng đã xác nhận sự thay đổi vai trò của ông qua email với TechCrunch.

Đến nay, OpenAI vẫn chưa đưa ra bất kỳ cập nhật nào về tiến độ của Media Manager, và công ty đã bỏ lỡ thời hạn tự đặt ra để hoàn thành công cụ này “trước năm 2025.” (Cần lưu ý rằng “trước năm 2025” có thể được hiểu bao gồm cả năm 2025, nhưng TechCrunch cho rằng ý OpenAI là trước ngày 1 tháng 1 năm 2025.)

Vấn đề sở hữu trí tuệ

Các mô hình AI như của OpenAI học các mẫu dữ liệu để đưa ra dự đoán — ví dụ, rằng một người cắn vào chiếc bánh mì sẽ tạo ra dấu vết của một vết cắn. Điều này giúp các mô hình học cách thế giới vận hành, ở một mức độ nào đó, thông qua quan sát. ChatGPT có thể viết những email và bài luận thuyết phục, trong khi Sora, công cụ tạo video của OpenAI, có thể tạo ra những cảnh quay khá chân thực.

Khả năng sử dụng các ví dụ về văn bản, phim ảnh và nhiều lĩnh vực khác để tạo ra các tác phẩm mới khiến AI trở nên vô cùng mạnh mẽ. Nhưng nó cũng có tính chất sao chép. Khi được yêu cầu theo một cách nhất định, các mô hình — phần lớn được huấn luyện trên vô số trang web, video và hình ảnh — tạo ra những bản sao gần như chính xác của dữ liệu đó, mặc dù những dữ liệu này có thể là "công khai," nhưng không được phép sử dụng theo cách này.

Ví dụ, Sora có thể tạo ra các video có logo của TikTok và các nhân vật game nổi tiếng. The New York Times đã khiến ChatGPT trích dẫn các bài báo của họ một cách chính xác (OpenAI giải thích hành vi này là do một "lỗ hổng").

Điều này đã làm các nhà sáng tạo, những người tác phẩm của họ bị đưa vào huấn luyện AI mà không có sự đồng ý, vô cùng phẫn nộ. Nhiều người trong số họ đã thuê luật sư.

OpenAI đang chiến đấu với các vụ kiện tập thể từ các nghệ sĩ, nhà văn, YouTuber, nhà khoa học máy tính và các tổ chức truyền thông, tất cả đều cáo buộc rằng công ty đã huấn luyện trên các tác phẩm của họ một cách bất hợp pháp. Những người kiện bao gồm các tác giả như Sarah Silverman và Ta Nehisi-Coates, các nghệ sĩ thị giác, và các tập đoàn truyền thông lớn như The New York Times và Radio-Canada.

OpenAI đã tìm cách ký kết các thỏa thuận cấp phép với các đối tác lựa chọn, nhưng không phải tất cả các nhà sáng tạo đều thấy các điều khoản đó hấp dẫn.

Quản lý phương tiện

OpenAI cung cấp cho các nhà sáng tạo một số cách thức tạm thời để "rút lui" khỏi việc huấn luyện AI của công ty. Vào tháng 9 năm ngoái, công ty đã ra mắt một biểu mẫu cho phép các nghệ sĩ đánh dấu tác phẩm của họ để loại bỏ khỏi các bộ dữ liệu huấn luyện trong tương lai. Và OpenAI đã cho phép các quản trị viên web chặn bot thu thập dữ liệu của họ từ các miền của họ từ lâu.

Tuy nhiên, các nhà sáng tạo đã chỉ trích những phương pháp này là thiếu hệ thống và không đầy đủ. Không có cơ chế rút lui cụ thể cho các tác phẩm viết, video hoặc bản ghi âm. Và biểu mẫu rút lui cho hình ảnh yêu cầu phải gửi một bản sao của mỗi hình ảnh cần loại bỏ kèm theo một mô tả, một quy trình khá phức tạp.

Media Manager được quảng cáo là một cuộc cải cách hoàn chỉnh — và mở rộng — các giải pháp rút lui của OpenAI hiện tại.

Trong bài đăng thông báo vào tháng 5, OpenAI cho biết Media Manager sẽ sử dụng "nghiên cứu học máy tiên tiến" để giúp các nhà sáng tạo và chủ sở hữu nội dung "nói cho [OpenAI] biết những gì họ sở hữu." OpenAI, công ty cho biết họ đang hợp tác với các cơ quan quản lý khi phát triển công cụ này, hy vọng rằng Media Manager sẽ "đặt ra một tiêu chuẩn trong ngành AI."

Từ đó đến nay, OpenAI chưa bao giờ công khai đề cập đến Media Manager.

Một phát ngôn viên của OpenAI cho TechCrunch biết rằng công cụ này "vẫn đang được phát triển" tính đến tháng 8, nhưng không phản hồi yêu cầu bình luận sau đó vào giữa tháng 12.

OpenAI không cho biết khi nào Media Manager sẽ ra mắt — hoặc thậm chí công cụ này sẽ có những tính năng và khả năng nào.

Sử dụng hợp lý

Giả sử Media Manager sẽ ra mắt vào một thời điểm nào đó, các chuyên gia không tin rằng công cụ này sẽ làm giảm bớt lo ngại của các nhà sáng tạo — hoặc giải quyết được các câu hỏi pháp lý liên quan đến việc sử dụng AI và quyền sở hữu trí tuệ.

Adrian Cyhan, một luật sư sở hữu trí tuệ tại Stubbs Alderton & Markiles, cho biết Media Manager như mô tả là một công việc đầy tham vọng. Ngay cả những nền tảng lớn như YouTube và TikTok cũng gặp khó khăn với hệ thống nhận diện nội dung ở quy mô lớn. Liệu OpenAI có thể làm tốt hơn không?

"Đảm bảo tuân thủ các yêu cầu bảo vệ quyền lợi của nhà sáng tạo và các yêu cầu bồi thường tiềm năng đang được xem xét là những thách thức," Cyhan nói với TechCrunch, "đặc biệt là khi xét đến bối cảnh pháp lý đang thay đổi nhanh chóng và có thể khác biệt giữa các quốc gia và địa phương."

Ed Newton-Rex, người sáng lập Fairly Trained, một tổ chức phi lợi nhuận chứng nhận các công ty AI tôn trọng quyền của các nhà sáng tạo, cho rằng Media Manager sẽ không công bằng khi chuyển gánh nặng kiểm soát việc huấn luyện AI lên vai các nhà sáng tạo; bằng cách không sử dụng nó, họ có thể đang ngầm đồng ý cho tác phẩm của mình được sử dụng. "Hầu hết các nhà sáng tạo sẽ không bao giờ nghe thấy về nó, chưa kể đến việc sử dụng nó," ông nói với TechCrunch. "Nhưng nó sẽ vẫn được sử dụng để biện minh cho việc khai thác hàng loạt các tác phẩm sáng tạo trái với nguyện vọng của các tác giả."

Mike Borella, đồng chủ tịch nhóm thực hành AI của MBHB, chỉ ra rằng các hệ thống rút lui không luôn tính đến các biến đổi có thể xảy ra đối với tác phẩm, như một hình ảnh đã được giảm kích thước. Joshua Weigensberg, một luật sư về sở hữu trí tuệ và truyền thông tại Pryor Cashman, cũng cho rằng vấn đề này chưa được giải quyết, khi mà các nền tảng bên thứ ba thường xuyên lưu trữ bản sao nội dung của các nhà sáng tạo.

"Những người sáng tạo và chủ sở hữu bản quyền không kiểm soát, và thường không biết, nơi tác phẩm của họ xuất hiện trên internet," Weigensberg nói. "Ngay cả khi một nhà sáng tạo nói với mọi nền tảng AI rằng họ muốn rút lui khỏi huấn luyện, các công ty này có thể vẫn tiếp tục huấn luyện trên bản sao tác phẩm của họ có sẵn trên các trang web và dịch vụ của bên thứ ba."

Media Manager có thể không mang lại lợi ích rõ ràng cho OpenAI, ít nhất là từ góc độ pháp lý. Evan Everist, một đối tác tại Dorsey & Whitney chuyên về luật bản quyền, cho biết mặc dù OpenAI có thể sử dụng công cụ này để chứng minh với tòa án rằng họ đang giảm thiểu việc huấn luyện trên nội dung có bảo vệ bản quyền, nhưng Media Manager có thể không giúp công ty tránh khỏi việc bồi thường nếu bị phát hiện vi phạm.

"Chủ sở hữu bản quyền không có nghĩa vụ phải đi ra ngoài và thông báo trước cho người khác không xâm phạm tác phẩm của họ trước khi vi phạm xảy ra," Everist nói. "Các nguyên tắc cơ bản của luật bản quyền vẫn áp dụng — tức là không lấy và sao chép tác phẩm của người khác mà không có sự cho phép. Tính năng này có thể nhiều hơn là một chiến lược PR và định vị OpenAI như một người sử dụng nội dung có đạo đức."

Một cuộc đối đầu

Trong khi Media Manager chưa ra mắt, OpenAI đã áp dụng các bộ lọc — mặc dù không hoàn hảo — để ngăn các mô hình của họ tái tạo lại ví dụ từ quá trình huấn luyện. Và trong các vụ kiện mà công ty đang đối mặt, OpenAI tiếp tục khẳng định quyền sử dụng hợp lý, cho rằng các mô hình của họ tạo ra các tác phẩm có tính chuyển hóa, không phải sao chép.

OpenAI có thể sẽ thắng trong các tranh chấp bản quyền này.

Các tòa án có thể quyết định rằng AI của công ty có “mục đích chuyển hóa,” theo tiền lệ được thiết lập khoảng một thập kỷ trước trong vụ kiện ngành xuất bản chống lại Google. Trong vụ kiện đó, tòa án đã xác định rằng việc Google sao chép hàng triệu cuốn sách cho Google Books, một loại kho lưu trữ kỹ thuật số, là hợp pháp.

OpenAI đã công khai cho biết rằng sẽ là "không thể" huấn luyện các mô hình AI cạnh tranh mà không sử dụng tài liệu có bản quyền — dù có được cấp phép hay không. "Giới hạn dữ liệu huấn luyện chỉ đối với sách trong phạm vi công cộng và các bản vẽ được tạo ra từ hơn một thế kỷ trước có thể tạo ra một thí nghiệm thú vị, nhưng sẽ không cung cấp các hệ thống AI đáp ứng nhu cầu của công dân ngày nay," công ty đã viết trong một bài trình bày vào tháng 1 gửi đến Hạ viện Anh.

Nếu các tòa án cuối cùng tuyên bố OpenAI thắng kiện, Media Manager sẽ không có nhiều giá trị pháp lý. OpenAI dường như sẵn sàng đánh cược điều này — hoặc xem xét lại chiến lược rút lui của mình.

OpenAI không thực hiện được công cụ từ chối (opt-out) mà họ đã hứa vào năm 2025

Thẻ / Từ khoá