Trénovanie jazykových modelov

20.05.2023

Viete o tom, že na trénovanie jazykových modelov sú použité aj informácie z webových stránok slovenských advokátov? Nájdete tam aj svoj web? 


V apríli tohto roku publikoval Washington Post 👉https://lnkd.in/eNfEhq7c analýzu súborov C4, ktoré pochádzajú od spoločnosti Google. Tieto súbory obsahujú neuveriteľných 15 miliónov webových stránok, ktoré slúžili ako zdroj pre trénovanie jazykových modelov, ako napríklad T5 od Google a LLaMA od Facebooku. OpenAI, ako viete, nezverejňuje podobné informácie.


Medzi týmito stránkami sa nachádzajú aj webstránky, ako je napríklad:


👉 najpravo.sk,
👉 otvorenesudy.sk,

ale aj stránky slovenských advokátov, ako sú:


👉 bernik-partneri.sk
👉 relevans.sk.


Ešte by som rád poukázal na nový vývoj v prehliadači Bing, ktorý okrem nájdenia relevantných webových stránok ponúka aj čo najpresnejšie zhrnutie odpovedí priamo z týchto stránok, spolu s odkazmi na zdroje. Tento vývoj naznačuje, že návštevníci budú pravdepodobne čoraz viac využívať tieto zdroje pri svojej online interakcii. 

To znamená, že pre advokátov bude v blízkej budúcnosti ešte dôležitejšie mať na svojich webových stránkach kvalitný obsah, ktorý priláka potenciálnych klientov. Je preto výhodou začať ho vytvárať už teraz a využiť k tomu aj správne nastavené procesy a technológie v advokátskych kanceláriách, ktoré vám môžu pomôcť s tvorbou tohto obsahu.

autor: JUDr. Mojmír Mochnáč