fbpx

L’azienda californiana ha presentato un sistema di valutazione della neutralità del proprio chatbot, con il quale ha ottenuto risultati superiori rispetto ai concorrenti. Claude Sonnet 4.5 e Opus 4.1 superano GPT-5 e Llama 4 nei test di equidistanza, mentre viene reso disponibile uno strumento open-source per misurare l’imparzialità