DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

toucan

Les becs de toucan sont des modèles de force légère

J'ai utilisé Claude Opus 4.6 pendant environ 30 heures depuis sa sortie. C'est le meilleur modèle en termes de personnalité/tempérament depuis Sonnet 3.5 New, mais j'ai trouvé pas mal de problèmes subtils dans mon utilisation. (1) Il a tendance à être légèrement dramatique ou insistant lorsqu'il fait des recommandations ou des analyses. Il termine fréquemment sa réponse par une phrase courte, en gras et abrupte qui semble se croire importante ou qui dégage un sentiment d'urgence. C'est un peu comme dans l'écriture créative quand les modèles essaient d'être profonds ; Opus essaie vraiment d'être urgent-dramatique-insistant (pas toujours— peut-être 25-30 % des conversations ?) (2) Il est extrêmement flatteur, mais de manière subtile. Au lieu de vous louer directement comme le faisait 4o, il agit comme si vous lui aviez ouvert l'esprit ou dit quelque chose de vraiment intelligent. Ensuite, il se fixe de manière excessive sur ce que vous avez dit au lieu d'étendre la discussion ou d'introduire d'autres idées pertinentes. (3) Il est trop d'accord avec ce qu'il pense que vous voulez qu'il dise (essayez de lui poser des questions financières ou médicales et regardez comment il réagit à votre tolérance au risque implicite). (4) Il est trop crédule lors des recherches, au point d'être pratiquement inutilisable car il tombe dans tous les pièges du blogspam SEO (essayez de demander des recommandations de produits dans n'importe quelle catégorie fortement optimisée pour le SEO - par exemple, matelas, VPNs). (5) Il a de graves problèmes d'hallucinations après peut-être 6 ou 7 échanges dans presque chaque discussion technique/détaillée que j'ai eue avec lui. J'en parle ailleurs, mais il y a deux problèmes distincts à cela. L'un est qu'il a tendance à croire en des idées qui sont en dehors du courant dominant et à les présenter comme complètes, correctes ou largement acceptées. L'autre est qu'il invente des informations qui, lorsque vous regardez de plus près, sont un mélange de choses réelles et factuelles, mais qui n'existent pas réellement ; un peu comme s'il hallucine des résultats pour des expériences décrites dans la section Travaux futurs de la littérature. Je lui ai surtout parlé pour des questions générales sur la science, l'histoire, la médecine ou le droit, ainsi que pour des recherches sur des produits ou des voyages. Je l'ai utilisé un peu pour le code Claude, mais ces commentaires concernent principalement les questions-réponses.

Meilleurs

Classement

Favoris