Ενα αρκετα ικανοποιητικο chatbot επιπεδου GPT-4, ειναι αυτο που εχουν συν-αναπτυξει σε εργαστηρια των Berkeley/Carnegie Mellon/Stanford/San Diego.
Λεγεται Vicuna, βασιζεται στο κωδικα του LLaMA του φουμπου που διερρευσε και το κοστος για να τρεξουν αυτοι οι αλγοριθμοι ειναι καπου στο 300αρι ευρω στους σερβερ της αμαζον.
εδω ινφο για το προτζεκτ:
<p>We introduce Vicuna-13B, an open-source chatbot trained by fine-tuning LLaMA on user-shared conversations collected from ShareGPT. Preliminary evaluation ...
vicuna.lmsys.org
εδω επιδειξη του chatbot που του γραφετε πραματα και απανταει
βεβαια ακομη και σε επιπεδο GPT-4 τα hallucinations των LLM δεν μπορουν να θεραπευτουν οσο scaling και να πεσει:
χαρακτηριστικο παραδειγμα
edit:
ενα μισαωρακι μεταξυ του Andrew Ng (απο τους δυνατοτερους επιστημονες στη μηχανικη μαθηση) και του Yann LeCun (κορυφαιος επιστημονας που δουλευει στο τομεα ΑΙ του φουμπου, αλλα κατ'εμε φαινεται να προωθει την εταιρικη ατζεντα και το proprietary κωδικα πολυ περισσοτερο αποσο του επιτρεπει ο σεβασμος στην ερευνα του)
Εχει πολυ πειστικα παραδειγματα εναντια στην αξιωση για παυση της ερευνας πανω στη generative LLM ΑΙ
Τα σημαντικοτερα σημεια του τα γραφει το πρωτο σχολιο