Kurzy na deeplearning.ai: Intro + Building Systems with the chatGPT API
Oplatí sa investovať 4 hodiny do kurzu o stavbe konverzačných botov pomocou chatGPT?
Nájsť nové materiály pre predmet Applied Machine Learning znamená prechádzať stále nové zdroje, aby sme sa udržali aktuálny. A pretože mám rád Andrew Ng už od jeho prvého kurzu o strojovom učení na coursere, tak začíname od jeho portálu deeplearning.ai. Ponúkané kurzy sú zdarma, nie sú príliš teoretické a ani nie sú príliš dlhé. Za mňa majú význam na doplnenie si znalostí pre konkrétnu tému.
Kurz Building Systems with chatGPT API (~4 hodiny) ukazuje ako sa stavia reálny konverzačný bot pre eshop. Kombinácia jupyter notebook + video s hovoriacou hlavou, ktoré komentuje kód je za mňa na tento účel výborná. Kľúčové informácie sú:
rozdelenie rolí v dialógu na system (inštrukcie, nastavenie chovaniu), assistant (odpovede z LLM) a user (prompty)
zmienenie OpenAI Moderation API a základné techniky proti útokom na LLM
koncept Chain of Thoughts Reasoning
výhody rozdelenia dlhého promptu na kroky a testovanie medzivýsledkov. Lebo JSON s “faktami” sa kontroluje ľahšie ako vygenerovaný text
testovanie “tvrdého “ výstupu proti očakávaným informáciám. Oceňujem ukážku, kde sa rieši porovnávanie medzi množinami výsledkov (podmnožina / nadmnožina).
testovanie textového výstupu pomocou odpovedí na definované otázky z vygenerovaného obsahu. A následne už “tvrdé” porovnávanie ako v predchádzajúcej odrážke.
Za zmienku by určite ešte stálo zmieniť nástroje, ktoré riešia evaluáciu a uľahčujú prácu (+ kedy dáva zmysel manuálna anotácia, iné LLM). A to najmä, aby sa ľudia nesnažili to písať od začiatku. Druhá pripomienka je o zmienený alternatívneho postupu, kedy voláme “naše” funkcie priamo z chatGPT (Function Calling).
Celková obtiažnosť by mal byť “Beginner to Advanced”, ale za mňa tam nebolo nič pokročilejšie, takže by som to hodnotil ako vhodné pre začiatočníkov. Pre niekoho skúsenejšieho by som ho neodporúčal.