Jak naučit AI chatbota z webových stránek?

Ahoj! Lákalo by mě udělat chatbota natrénovaného z webu našich novin. Máme řádově 2000 existujících textů, představuju si, že by se ten chatbot na nich natrénoval a následně byl schopen konverzovat o tématech, která pokrýváme. (Nebo bysme ho pak přepli na generování nových textů a vzali si dovču :–)

Neznáte nějaký existující produkt, který by tohle nabízel? Našel jsem SiteSpeakAI, ale mají pro nás nepoužitelné ceny, $30 měsíčně za 30 zdrojových webových stránek.

Případně jde tohle nějak snadno zařídit přes OpenAI API?

ChatGPT plus umi vytvorit chatbota s kontextem ~300 stranek (jako normostran). Tak si to na mensim vzorku muzes vyzkouset.

Jinak jsou dve moznosti s OpenAI API:

  • Vytvorit si zpracovani ve vektorove DB vsech vasich textu a to pouzit jako kontext ve kterem hleda. Nefunguje to uplne dobre, protoze to neni primo propojene. A je to drahe. Pocitej tak s $0.1/stranku tokenizace dokumentu. A potom relativne drahe dotazy (GPT-4 je obecne drahy pres API).
  • OpenAI umi “dotrenovani” v enterprise variante, ale to jsem zatim nepouzil.

Ale s temi potunenymi boty primo v ChatGPT+ pracuju hodne a je to super, doporucuju zkusit a uvidis.

1 Like