Motorul de căutare al SeMI Technologies deschide noi modalități de a vă interoga datele

Companiile se bazează pe o mulțime de date nestructurate și de multe ori nu au capabilitățile de a obține prea multe din acestea.

Acum imaginați-vă că aveți o modalitate de a stoca datele și de a putea să le puneți întrebări, de exemplu, „Când a semnat compania ABC primul contract cu noi?” sau „Arată-mi videoclipuri care conțin cer albastru”.

Acesta este ceea ce SeMI Technologies construiește cu Weaviate, un motor de căutare vectorială. Este un tip unic de bază de date AI-first, care utilizează modele de învățare automată care scot vectori, cunoscuți și sub denumirea de embeddings, de unde și motorul de căutare a vectorilor, a declarat Bob van Luijt, CEO și co-fondator al SeMI.

Am explicat că motoarele de căutare vectoriale nu sunt noi — Căutarea Google este un exemplu de soluție construită pe deasupra unui motor de căutare vectorială. Cu toate acestea, scopul SeMI este de a comercializa această tehnologie și are un model de afaceri open source, astfel încât oricine să o poată folosi.

Anul trecut, Van Luijt i-a oferit colegului meu, Alex Wilhelm, o privire sub capota tehnologiei, creând un motor de căutare semantic care oferă răspunsuri la întrebări pentru articolele Techcrunch din 2021.

„Toată lumea poate folosi tehnologia și avem instrumente și servicii pentru acele companii care au nevoie de acest lucru”, a adăugat van Luijt. „Noi nu creăm sau distribuim modelele reale – este ceva ce fac companii precum Huggingface sau OpenAI, sau companiile își fac modele. Dar a avea modele este una, folosirea lor pentru a-ți alimenta sistemele de căutare și recomandare în producție este alta și exact asta rezolvă Weaviate.”

De când a fondat compania în 2019 cu CTO Etienne Dilocker și COO Micha Verhagen, van Luijt a văzut că tehnologia SeMI a inspirat peste 100 de cazuri de utilizare, inclusiv startup-uri, precum Keenious sau Zencastr, creând noi afaceri bazate pe noile posibilități pe care le oferă un motor de căutare vectorială. și utilizări în care rezultatele oferite de Weaviate ajută direct oamenii, de exemplu, în domeniul medical.

Unele dintre favoritele personale ale lui van Luijt au fost cele despre care el a spus că sunt mai „ezoterice”, inclusiv vectorizarea și căutarea prin genomul uman, cartografierea întregii lumi în vectori sau așa-numitele înglobări de grafice, care pot fi căutate cu ușurință. cu Weaviate, ca o demonstrație SeMI creată pe încorporarea graficelor Meta Researches.

SeMI a strâns o sumă de 1,2 milioane USD în august 2020 de la Zetta Venture Partners și ING Ventures și de atunci a fost pe radarul companiilor cu capital de risc. De atunci, software-ul său a fost descărcat de aproape 750.000 de ori, o creștere de aproximativ 30% pe lună. Van Luijt nu a oferit detalii despre valorile de creștere ale companiei, dar a spus că numărul de descărcări se poate corela cu vânzările de licențe de întreprindere și servicii gestionate. În plus, creșterea în utilizare și înțelegere a valorii adăugate a Weaviate a făcut ca toate valorile de creștere să crească, iar compania să-și epuizeze finanțarea de început.

Deși finanțarea de început a dispărut, compania nu a căutat în mod activ noi finanțări. Cu toate acestea, când co-fondatorii SeMI au întreținut conversații cu Cortical Ventures, un nou fond de la foștii fondatori Datarobot și New Enterprise Associates (NEA), van Luijt a spus că firmele le-au arătat cum ar sprijini afacerea.

„A fost cu adevărat „ciupiți-mi brațul uluitor” minunat”, a adăugat el. „Tot ce au făcut ei în trecut, echipele care ne susțin, a fost exact ceea ce căutăm și pot spune, deși din experiență foarte proaspătă, toate poveștile uimitoare sunt adevărate.”

Acele conversații au condus la NEA și Cortical să conducă împreună o nouă rundă de finanțare de 16 milioane de dolari în dolari din seria A.

SeMI intenționează să implementeze noua finanțare în angajarea de talente din SUA și Europa și să dubleze comunitatea sa open source atât pentru Weaviate, cât și pentru căutarea vectorială în general. De asemenea, își va spori concentrarea asupra pieței și produselor din nucleul open-source și va face primii pași în cercetare în care învățarea automată se suprapune cu informatica.

Între timp, van Luijt consideră că ne uităm la următorul val de tehnologie a bazelor de date care a început cu valul SQL care a introdus mari câștigători, precum Oracle și Microsoft, urmat de un al doilea val a fost valul de baze de date fără SQL, cu câștigători precum MongoDB. și Redis.

„Suntem acum în pragul unei noi generații de baze de date, cei care sunt mai întâi AI, iar Weaviate este un exemplu în acest sens”, a adăugat el. „Trebuie să educăm piața nu numai despre Weaviate, ci și despre bazele de date de căutare vectorială sau, de altfel, bazele de date bazate pe inteligența artificială. Acesta este un lucru extrem de interesant de făcut, deoarece învățarea automată aduce ceva extraordinar de minunat la masă. De exemplu, ca baza de date să răspundă la întrebări în limbaj natural peste milioane – sau chiar miliarde – de documente sau să „înțeleagă” ce conțin milioane de fotografii sau videoclipuri.”

Leave a Comment