Un ricercatore lancia un prototipo in lingua olandese basato su Microsoft Phi – IT Pro – Notizie

C'è Bram VanRooy, il creatore di Fietje. Anche il creatore di molti dei più forti CAPRA ULTRA.

Per evitare molti commenti negativi: temevo che gli utenti facessero paragoni con altri modelli più potenti (come GOAT Ultra, Mixtrals, new Llamas o anche ChatGPT). Questo è comprensibile, ma non è affatto l'obiettivo di Vietye! Il Fietje è 2,5 volte più piccolo dell'Ultra, quindi raggiungerai rapidamente i limiti delle conoscenze e delle abilità che puoi racchiudere in un unico modello! Ho provato a sottolinearlo attraverso diverse descrizioni, ma lo ripeto: l'intento non è quello di catturare un nuovo stato di progresso, e questo semplicemente non è possibile su questa scala. L'obiettivo è sempre stato quello di avere un modello piccolo che trovasse un equilibrio tra l'essere il più piccolo possibile e l'essere comunque utile per alcune attività, ad esempio nell'hardware di fascia alta e nella ricerca in un ambiente con risorse limitate in cui l'implementazione di un modello più grande non è possibile. fattibile. Invece di costruire modelli più ampi (il che è certamente utile), ora mi concentro innanzitutto sul miglioramento dell’accessibilità della tecnologia linguistica. Naturalmente, questo è solo un passo nel processo e continueremo ad andare avanti con nuovi progetti e idee. Forse sarà una melodia del Mixtral, o forse del Llama 3, o forse solo un altro piccolo phi-3!

Ho anche chiesto all'autore di cancellare questa frase “Ma sii bravo come il modello più grande.” E aggiungere nel testo per chiarimento quanto segue: “Sebbene Fietje Negli standard Funziona quasi bene come il GEItje 7B Ultra, ma in realtà è meno potente. Pertanto è inteso come un passo avanti verso l'esecuzione locale di LLM, anche su piccoli dispositivi come un Raspberry PI o un telefono.” Ho anche chiesto all'autore di sostituire lo screenshot. Non sorprende che Fietje non sappia cosa fare: c'è nessun messaggio di sistema, quindi è Lei non sa che l'ho creata io, e non sa come è stata creata/allenata, quindi pensa di dover fingere di essere una giornalista a cui piace allenarsi (in palestra per esempio. ) Penso che questo screenshot sia il migliore, il che dimostra che Fietje può creare un personaggio DnD per te in JSON!

READ  Il Giappone non ha ancora abbandonato il lander lunare SLIM

Infine: ciò che trovo molto importante è la costruzione della comunità e la trasparenza. Quindi i set di dati, i modelli, il codice di addestramento e la cronologia della mia formazione Tutto il pubblico È aperto a tutti nella speranza di motivare altri ricercatori a essere altrettanto trasparenti e a lavorare insieme per migliorare la tecnologia linguistica per l'olandese.

Se hai domande sui LLM, puoi sempre farle di seguito. Rendiamolo una divertente sessione di domande e risposte! Sono anche molto interessato a quello che vuoi tu come comunità di Tweakers: più grande è, meglio è, o continuare a vivere bordo? Posso saperlo!

[Reactie gewijzigd door BramVroy op 1 mei 2024 00:50]

We will be happy to hear your thoughts

Leave a reply

TGcomnews24