La bibliothèque de la faculté de droit de Harvard a annoncé aujourd'hui le lancement de l'Institutional Data Initiative, une initiative de recherche par laquelle la bibliothèque de la faculté de droit de Harvard travaillera avec des bibliothèques, des musées, des agences gouvernementales et d'autres institutions pour publier ses collections sous forme de données. Ces données peuvent être utilisées à diverses fins, notamment pour la formation de modèles d’intelligence artificielle.
L'Institutional Data Initiative (IDI) se concentrera d'abord sur le raffinement du million de livres du domaine public numérisés par les bibliothèques de Harvard. Il travaillera également avec la Bibliothèque publique de Boston pour rendre disponibles des millions de pages de journaux historiques sous forme de données. Bien que ces ensembles de données soient constitués de textes longs, l'IDI cherche à collaborer avec d'autres institutions pour développer des données dans divers formats, notamment des données scientifiques et biomédicales.
Le lancement d'IDI est soutenu par Microsoft et OpenAI. Pour un financement à long terme, IDI prévoit de s'associer à plusieurs organismes de bienfaisance et soutiens de l'industrie.
Burton Davis, vice-président et avocat général adjoint de Microsoft, a exprimé les opinions suivantes sur l'IDI :
« Microsoft est fier de soutenir la création de l'Institutional Data Initiative, qui vise à accroître l'accès aux connaissances et aux données de haute qualité pour tous les créateurs d'IA. Nous nous engageons à permettre un accès généralisé aux données et à renforcer un écosystème d'IA plus inclusif.
Microsoft a toujours pensé que chacun pouvait bénéficier d’une collaboration autour de données ouvertes et disponibles. En fait, dès 2020, Microsoft a lancé un mouvement de données ouvertes grâce auquel les organisations de toutes tailles peuvent accéder aux données nécessaires au développement d’applications d’intelligence artificielle.
Tom Rubin, directeur de la propriété intellectuelle et du contenu d'OpenAI, a déclaré ce qui suit à propos du lancement de l'IDI :
« Les établissements universitaires sont depuis longtemps des partenaires importants dans la recherche et le progrès de l'IA, et l'Institutional Data Initiative de l'Université Harvard en est un bon exemple. Le domaine public joue un rôle essentiel dans la diffusion des connaissances et de la créativité, et OpenAI est ravi de soutenir cet effort. Nous sommes inspirés par le leadership du professeur Zittrain sur cet important projet, et nous sommes très impatients de voir l'impact qu'il aura.
En fournissant de grands ensembles de données facilement accessibles, l’IDI contribue à l’avancement de la technologie de l’intelligence artificielle et à son accessibilité à tous.