Bbabo NET

Nauka & Technologia Wiadomości

Startup Vana wprowadził platformę do „wynajmowania” danych Reddit na potrzeby szkoleń AI

Startup Vana opracowała platformę, która pozwoli użytkownikom Reddita „wynajmować” dane w celu trenowania modeli AI.

Anna Kazlauskas i Art Abal z MIT Media Lab założyli firmę Vana w 2021 roku. Ten pierwszy studiował informatykę i ekonomię na MIT, a następnie założył startup Iambiq zajmujący się automatyzacją technologii fintech. Abal pracował jako prawnik w firmie konsultingowej The Cadmus Group, a następnie w firmie Appen zajmującej się adnotacjami danych.

Platforma Vany umożliwi użytkownikom „agregowanie” danych – w tym czatów, nagrań rozmów i zdjęć – w zestawy, które można następnie wykorzystać do szkolenia generatywnego modelu sztucznej inteligencji. Umożliwi także bardziej spersonalizowane doświadczenia, takie jak aplikacja artystyczna, która rozumie preferencje stylistyczne użytkowników.

Interfejs API Vana integruje wieloplatformowe dane osobowe, a aplikacja ma natychmiastowy dostęp do spersonalizowanego modelu sztucznej inteligencji lub podstawowych danych użytkownika, co upraszcza wdrożenie i eliminuje obciążenie obliczeniowe.

Aby utworzyć konto w Vana, musisz zweryfikować swój adres e-mail, dołączyć dane do swojego cyfrowego awatara (takie jak selfie, własny opis i nagrania głosowe) oraz przeglądać aplikacje utworzone przy użyciu platformy i zbiorów danych. Wybór aplikacji sięga od chatbotów w stylu ChatGPT i interaktywnych książeczek z opowieściami po generator profili Hinge.

Vana będzie pobierać od użytkowników miesięczną subskrypcję, a plany zaczynają się od 3,99 USD. Deweloperzy będą pobierani opłatę za „transakcje danymi” (np. za przesyłanie zestawów do trenowania modeli AI).

W tym miesiącu Vana uruchomiła Reddit Data DAO, program, który agreguje dane Reddit wielu użytkowników (w tym ich karmę i historię postów) i pozwala im wspólnie decydować, jak wykorzystać połączone zestawy danych. Użytkownicy będą mieli prawo głosować wraz z innymi członkami DAO w sprawie decyzji takich jak licencjonowanie połączonych danych firmom zajmującym się generatywną sztuczną inteligencją oraz będą dzielić się zyskami. DAO ma nieco ponad 141 000 członków, co stanowi zaledwie niewielką część z 73 milionów użytkowników Reddita. Obecnie Reddit Data wydaje „tokeny” użytkownikom odpowiadającym ich karmie Reddit.

Reddit nie blokował wcześniej dostępu do danych szkoleniowych dotyczących sztucznej inteligencji, ale pod koniec ubiegłego roku, przed pierwszą ofertą publiczną, firma zmieniła kurs i otrzymała ponad 203 miliony dolarów opłat licencyjnych od firm, w tym Google.

Reddit zbanował teraz subreddit Vana poświęcony omawianiu DAO. Rzecznik platformy oskarżył startup o „wykorzystywanie” systemu eksportu danych, który ma być zgodny z przepisami RODO i kalifornijską ustawą o ochronie prywatności konsumentów.

Wcześniej okazało się, że twórca oprogramowania do podpisu elektronicznego, DocuSign, zaczął wykorzystywać dane użytkowników do uczenia modeli sztucznej inteligencji. Wyjaśniła, że ​​będzie prosić użytkowników o zgodę, zanim wykorzystają ich dane do takiego szkolenia w zakresie sztucznej inteligencji. Ponadto dane zostaną wstępnie zanonimizowane.

Startup Vana wprowadził platformę do „wynajmowania” danych Reddit na potrzeby szkoleń AI