Uncategorized

Linux Foundation представляет новую разрешительную лицензию для совместной работы с открытыми данными

Повысьте уровень технологий и стратегии корпоративных данных на Transform 2021.


Linux Foundation объявила о новой разрешительной лицензии, призванной способствовать сотрудничеству в области открытых данных для проектов искусственного интеллекта (AI) и машинного обучения (ML).

Часто говорят, что данные – это новая нефть, но, в частности, для проектов AI и ML наличие доступа к обширным и разнообразным наборам данных является ключом к снижению предвзятости и созданию мощных моделей, способных выполнять всевозможные интеллектуальные задачи. Для машин данные немного похожи на «опыт» для людей – чем больше у вас их есть, тем более правильные решения вы, вероятно, примете.

С CDLA-Permissive-2.0 Linux Foundation опирается на свои предыдущие усилия по поощрению усилий по совместному использованию данных посредством лицензионных соглашений, которые четко определяют, как данные – и любые производные наборы данных – могут и не могут использоваться.

Пулы данных

Linux Foundation впервые представила лицензионное соглашение на данные сообщества (CDLA) еще в 2017 году, чтобы побудить организации открыть свои обширные пулы (недостаточно используемых) данных для третьих сторон. Существовали две исходные лицензии: лицензия на совместное использование с обоюдным обязательством «авторского лева», заимствованная из сферы программного обеспечения с открытым исходным кодом, оговаривающая, что любые производные наборы данных, построенные из исходного набора данных, должны совместно использоваться по аналогичной лицензии; и разрешающая лицензия (1.0) без каких-либо таких обязательств (аналогично тому, как кто-то может определить «настоящее» программное обеспечение с открытым исходным кодом).

Лицензии – это в основном юридические документы, в которых описывается, как часть работы (в данном случае наборы данных) может быть использована или изменена, но часто конкретных фраз, двусмысленностей или исключений может быть достаточно, чтобы заставить компании пробежать милю, если они думают, что выпуск контента под конкретная лицензия может вызвать у них проблемы где-то в будущем. И здесь вступает в игру лицензия CDLA-Permissive-2.0 – по сути, это переработанная версия 1.0, но она короче и проще. Но более того, он удалил некоторые положения, которые считались ненужными или обременительными и которые могли препятствовать более широкому использованию лицензии.

Например, версия 1.0 лицензии включала обязательства по сохранению получателями данных уведомлений об атрибуции в наборах данных. Для контекста, уведомления или заявления об авторстве являются стандартными в сфере программного обеспечения, где компания, выпускающая программное обеспечение, построенное на компонентах с открытым исходным кодом, должна указывать создателей этих компонентов в своей собственной лицензии на программное обеспечение. Но, согласно Linux Foundation, отзывы, полученные от сообщества и юристов, представляющих компании, участвующие в проектах открытых данных, показали, что существуют «проблемы, связанные с ассоциацией атрибуции с данными (или версиями наборов данных)».

Таким образом, хотя атрибуция источника данных все еще возможна и может иметь смысл для конкретных проектов, особенно в тех случаях, когда прозрачность имеет первостепенное значение, это больше не является условием для предприятий, желающих делиться данными в соответствии с новой разрешительной лицензией. Основное обязательство, которое остается, заключается в том, что основной текст лицензионного соглашения на данные сообщества включен в новые наборы данных.

Данные против программного обеспечения

Это также помогает подчеркнуть, что перенос концепции из лицензии на программное обеспечение в лицензию на набор данных не всегда имеет смысл, отчасти потому, что законы и нормативные акты обычно обрабатывают данные иначе, чем программное обеспечение и другой аналогичный творческий контент.

«Данные отличаются от программного обеспечения», – сказал VentureBeat вице-президент Linux Foundation по комплаенсу и праву Стив Уинслоу. «Программное обеспечение с открытым исходным кодом обычно создается из работ, охраняемых авторским правом, где авторство играет важную роль. Напротив, данные часто могут иметь мало или вообще не иметь применимых прав интеллектуальной собственности, а авторство и атрибуция часто менее важны ».

Но разве атрибуция по-прежнему не желательна, даже если она не всегда применима или актуальна? По словам Уинслоу, принуждение к атрибуции данных может иметь некоторые негативные последствия с точки зрения готовности организаций сотрудничать с данными.

«Некоторые получатели данных могут по-прежнему выбирать атрибуты данных, чтобы показать, что данные заслуживают доверия на основе их источника», – сказал Уинслоу. «Но это будет их призыв, а не требование, поскольку это может наложить ограничения на то, как организовывать и анализировать данные, или наложить непреднамеренную нагрузку на совместную работу над данными».

Например, предположим, что данные от нескольких участников, которых могут исчисляться тысячи, объединены в единый набор данных. Если набор данных когда-либо используется только в этой комбинированной форме, то атрибуция не будет большой проблемой. Но если впоследствии набор данных разбивается на подмножества, которые перераспределяются отдельно или объединяются с другим набором данных, то это создает массу работы с точки зрения определения того, какие атрибуты применимы к новому набору данных. Короче говоря, все может быстро погрузиться в беспорядок и хаос.

Переход

Несколько компаний уже объявили о планах сделать свои существующие наборы открытых данных доступными по новой лицензии CDLA-Permissive-2.0, включая исследовательское подразделение Microsoft, которое теперь перенесет некоторые из своих наборов открытых данных, включая Hippocorpus, Public Perception of Artificial Intelligence, Xbox Avatars. Описания, вложения двух слов и GPS-траектория.

В других местах IBM’s Project CodeNet, NOAA JFK, Airline Reporting Carrier On-Time Performance, PubLayNet и Fashion-MNIST также перейдут на новую лицензию.

VentureBeat

Миссия VentureBeat – стать цифровой городской площадью, где лица, принимающие технические решения, могут получить знания о преобразующих технологиях и транзакциях.

На нашем сайте представлена ​​важная информация о технологиях и стратегиях обработки данных, которая поможет вам руководить своей организацией. Мы приглашаем вас стать членом нашего сообщества, чтобы получить доступ:

  • актуальная информация по интересующей вас тематике
  • наши информационные бюллетени
  • закрытый контент для лидеров мнений и льготный доступ к нашим ценным мероприятиям, таким как Преобразование 2021: Учить больше
  • сетевые функции и многое другое

Стать членом

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button