Как ты смотришь на скармливание нейронкам всего контента из интернета, пренебрегая авторским правом и без согласия кого-либо?

M1inki

Для моих читателей и так давно не секрет, что такая часть авторского права, как копирайт, представляется мне сущностью безнадёжно устаревшей и крайне дорогой в плане энфорсмента, а потому немедленно отомрёт, как только этот самый энфорсмент перестанет осуществлять государство. Однако с появлением больших языковых моделей появились все основания полагать, что копирайт отомрёт даже и существенно раньше, чем государство.

В защиту копирайта есть разные доводы. Есть утилитарный: если все будут брать чужой контент бесплатно, то пропадёт стимул этот контент сочинять, а это конец прогресса. Есть объективистский: человек имеет право на продукт своего разума, и ниибёт, ведь так сказала Айн Рэнд. Есть этический: труд должен быть оплачен.

А потом оказывается, что для обучения очередной, более продвинутой версии большой языковой модели ей нужно скормить вообще весь корпус текстов, когда-либо созданных человечеством, а она сожрёт и попросит добавки. Если же этого не сделать, то перспективное направление развития информационных технологий упрётся в тупик. Тех, кто обучает модель, не волнуют художественные достоинства текста. Для них что библия, что фанфик по Гарри Поттеру – это просто текст, имеющий ключевое качество: написано человеком. Знание библии для языковой модели важнее, но лишь по той причине, что она, во-первых, объёмнее, а во-вторых, отсылки к ней куда чаще встречаются в других текстах и в пользовательских запросах.

И всё, мы сразу лишились утилитарного аргумента, ведь именно ради прогресса тексты и нужно скормить нейросети. Зато мы приобрели очень богатых лоббистов отмены копирайта, ведь компании, разрабатывающие большие языковые модели, вполне могут потягаться размерами капитала с цифровыми издательствами. К тому же, даже если для особо растиражированных текстов правообладатели сумеют отстоять право не знакомить с ними LLM, то кто выиграет от того, что в ответ на “перескажи такой-то рассказ Стивена Кинга” чатбот будет отвечать “не знаю ни одного произведения этого автора, давайте я вам лучше перескажу такой-то рассказ Дэвида Фридмана”. Уж наверное не издатели Стивена Кинга и не сам Стивен Кинг будут от подобного в выигрыше.

Как будет добываться контент для тренировки нейросетей? Очень просто. Контент уже как правило физически присутствует в сети в бесплатном доступе, просто он имеет ярлык “пиратский” и потому законопослушным компаниям приходится делать вид, что его не существует. Однако это слишком хлипкий заборчик, и он не остановит тех, кто считает себя вправе его перешагнуть. Не достанется нейросети разве что какой-нибудь Родион Белькович, потому что он в принципе не выкладывает в сеть свои книги, даже за деньги))) Это огромная потеря для будущих собеседников интеллектуальных чатботов, но что поделать, человечество за свою историю потеряло много ценных текстов, шит хэппенс.

Minecraft против авторского права

Волюнтарист, Битарх

Сторонники государственной монопольной привилегии под названием авторское и патентное право очень боятся, что без механизма силового наказания за неразрешённое копирование и распространение информационного контента, его создатели просто останутся ни с чем, пираты их обворуют и лишат без средств к существованию и стимула создавать новый контент в дальнейшем. Конечно же, существуют десятки способов монетизации контента и без применения подобной привилегии, однако сейчас мы не будем их анализировать, а просто посмотрим на один практический пример, о котором я давно знал, но вспомнил почему-то лишь совсем недавно. И этот пример – игра под названием Minecraft.

Создатель Minecraft Маркус Перссон является сторонником пиратства, он критикует сложившееся в крупных компаниях отношение к данному явлению, и даже состоит в Пиратской партии Швеции. Он никогда не был против того, чтобы люди свободно копировали и распространяли созданную им игру. Однако это не помешало заработать ему 640 миллионов шведских крон (около 100 миллионов долларов США) на продаже лицензионных копий игры только за 2012 год, а позже продать свою долю в созданной им компании Mojang за 2.5 миллиарда долларов (на данный момент её владельцем является корпорация Microsoft). Сам Minecraft же стал самой продаваемой игрой в мире, на 2020 год продано около 200 миллионов лицензионных копий.

Действительно, хоть и официально Minecraft является проприетарным программным обеспечением, в действительности он не защищён от копирования, его файлы никак не зашифрованы и любой человек может скачать и пользоваться ими, и это даже не ограничивают его нынешние правообладатели (хотя я не знаком с их будущими планами). Доступ к официальному лаунчеру игры есть только у игроков, купивших лицензионную копию, однако уже существует большое множество неофициальных лаунчеров, да и саму игру можно запустить без лаунчера, просто средствами командной строки. И для нелицензионных игроков доступна не только одиночная игра, но и мультиплеер. Ядро сервера игры в своих настройках имеет функцию, отключив которую владелец сервера может дать доступ на подключение всем желающим независимо от наличия в них лицензии, поэтому в игре существует большое множество нелицензионных серверов. И этот факт, кстати, тоже абсолютно никак не мешает развитию лицензионных серверов и заработку их владельцев.

Как мы видим, создав информационный контент можно вполне обойтись и без силовых привилегий. Их отсутствие не помешало Minecraft стать самой продаваемой игрой в мире, а создателю игры Маркусу Перссону пополнить список миллиардеров Forbes. Также существует множество примеров других игр, которые были взломаны и выложены на торрент-трекерах ещё до официального релиза, тем не менее продажи лицензионных ключей от этого не обрушились.