Bbabo NET

Vetenskap & Teknik Nyheter

Startup Vana introducerade en plattform för att hyra Reddit-data för AI-träning

Startup Vana har utvecklat en plattform som gör det möjligt för Reddit-användare att "hyra" data för att träna AI-modeller.

Anna Kazlauskas och Art Abal från MIT Media Lab grundade Vana 2021. Den förstnämnde studerade datavetenskap och ekonomi vid MIT och lanserade sedan fintech-automationsstartupen Iambiq. Abal arbetade som advokat på konsultfirman The Cadmus Group och sedan på dataanteckningsföretaget Appen.

Vanas plattform kommer att tillåta användare att "aggregera" sin data - inklusive chattar, talinspelningar och foton - till uppsättningar som sedan kan användas för att träna en generativ AI-modell. Det kommer också att möjliggöra mer personliga upplevelser, till exempel en konstapp som förstår användarnas stilpreferenser.

Vanas API integrerar plattformsoberoende personlig data, och appen har omedelbar tillgång till en personlig AI-modell eller underliggande användardata, vilket förenklar onboarding och eliminerar beräkningskostnader.

För att skapa ett konto hos Vana måste du verifiera din e-postadress, bifoga data till din digitala avatar (som en selfie, självbeskrivning och röstinspelningar) och utforska apparna som byggts med plattformen och datamängder. Urvalet av appar sträcker sig från chatbotar i ChatGPT-stil och interaktiva sagoböcker till Hinge-profilgeneratorn.

Vana kommer att debitera användarna ett månatligt abonnemang, med planer som börjar på $3,99. Utvecklare kommer att debiteras en avgift för "datatransaktioner" (till exempel för överföring av set för att träna AI-modeller).

Den här månaden lanserade Vana Reddit Data DAO, ett program som aggregerar flera användares Reddit-data (inklusive deras karma och posthistorik) och låter dem tillsammans bestämma hur de ska använda de kombinerade datamängderna. Användare kommer att ha rätt att rösta med andra DAO-medlemmar om beslut som licensiering av kombinerad data till generativa AI-företag och kommer att dela vinst. DAO har drygt 141 000 medlemmar, vilket bara är en liten del av Reddits 73 miljoner användarbas. För närvarande utfärdar Reddit Data "tokens" till användare som matchar deras Reddit-karma.

Reddit hade inte tidigare blockerat åtkomst till AI-träningsdata, men sent förra året, inför börsintroduktionen, vände företaget kursen och fick mer än 203 miljoner dollar i licensavgifter från företag inklusive Google.

Reddit har nu förbjudit Vana subreddit som är dedikerad till att diskutera DAO. En talesperson för plattformen anklagade uppstarten för att "utnyttja" sitt dataexportsystem, som är utformat för att följa GDPR och California Consumer Privacy Act-regler.

Tidigare blev det känt att mjukvaruutvecklaren DocuSign för elektroniska signaturer började använda användardata för att träna artificiell intelligensmodeller. Hon klargjorde att hon skulle be användarna om tillåtelse innan de använder deras data för sådan AI-utbildning. Dessutom kommer uppgifterna att preliminärt anonymiseras.

Startup Vana introducerade en plattform för att hyra Reddit-data för AI-träning