Article de Ken Brooks
La important cobertura mediàtica ha posat de manifest el creixent desig de la indústria tecnològica d’utilitzar contingut publicat per entrenar models de grans llenguatges (LLM) d’IA, sovint sense permís, la qual cosa suscita preocupacions sobre els drets de propietat intel·lectual i una compensació justa per als creadors de contingut. Com a resposta, molts editors han aconseguit acords de llicència amb empreses d’IA per intentar convertir aquest repte en una oportunitat.
Els exemples més recents de les notícies inclouen l’associació de tres anys que s’acaba d’anunciar de HarperCollins amb una empresa sense nom (que es diu que és Microsoft) que permetrà que els títols de la llista de no ficció seleccionats s’utilitzin per a la formació d’IA segons l’autorització d’autor, amb una tarifa. de 5.000 dòlars per llibre que es repartiran entre l’autor i l’editor. En l’àmbit de la publicació acadèmica i professional, Wiley i Taylor & Francis també han arribat a acords multimilionaris amb empreses d’IA.
Per descomptat, queden alguns obstacles importants. D’una banda, els autors semblen ser especialment escèptics a l’hora de potenciar la mateixa tecnologia que molts creuen que podria substituir-los. D’altra banda, moltes empreses tecnològiques creuen que l’ús d’obres amb drets d’autor sense llicència per a la formació en IA és un ús just i completament legal, amb diverses demandes de drets d’autor potencialment històrics encara en curs que podrien decidir la qüestió.
Enmig d’aquesta incertesa, és fonamental que els editors i els autors aprofitin la demanda creixent de dades de formació d’alta qualitat mitjançant l’establiment de marcs comercials i legals que puguin protegir els interessos dels autors i titulars de drets i equilibrar la innovació amb consideracions ètiques.
El següent ofereix als editors alguns consells inicials sobre com abordar el panorama de llicències d’IA en ràpida evolució.
Primer, coneix el teu valor
Les vendes, el mèrit literari, l’impacte cultural i les contribucions al coneixement humà són factors que poden millorar la funcionalitat d’una IA i augmentar la seva comercialització. I com és d’esperar, diferents tipus d’obres publicades tenen valors diferents per a diferents empreses d’IA.
Les editorials comercials, per exemple, se centren en la ficció i la no ficció populars, inclosos els més venuts i les obres amb un impacte cultural important. Per a aquests editors, els termes de llicència poden prioritzar títols d’alt perfil que poden millorar el llenguatge i la comprensió contextual d’un model d’IA.
Per als editors de STM, l’èmfasi es posa en la qualitat, la recentitat i la fiabilitat del seu contingut i dades. Els articles revisats per parells, els documents de recerca i les dades actualitzades són especialment valuosos per als models d’IA que requereixen informació precisa i precisa.
Per als editors educatius, l’alineació del contingut amb diversos nivells educatius, estàndards curriculars i eficàcia educativa és primordial. Els acords de llicència poden centrar-se en una cobertura integral de les matèries, garantint que les eines d’IA puguin proporcionar contingut precís i rellevant per als educadors.
En cada cas, entendre el valor del teu contingut és clau. Per exemple, el coneixement especialitzat, especialment de fonts autoritzades, millora la capacitat d’una IA per generar resultats precisos i perspicaces. Les publicacions recents també són més valuoses per als models d’IA, ja que la puntualitat pot afectar significativament el rendiment de l’IA per generar respostes actuals i rellevants. L’escriptura d’alta qualitat millora la capacitat de l’IA per generar un llenguatge natural i adequat al context, especialment important per als models dissenyats per interactuar amb els usuaris de manera conversacional.
I, per descomptat, la quantitat de llibres, paraules o “fitxes” (la unitat fonamental de dades que pot ser processada per un algorisme) també és un factor important. Igual que amb els termes de llicència de col·lecció tradicionals, una llista posterior més gran produirà un pagament més gran. De fet, les llicències d’IA sovint es redueixen a una valoració de cèntims per testimoni.
Article publicat a Publishersweekly, clica aquí per accedir-hi