Créez des applications d’IA basées sur la RAG et des agents avec Claude 3.5 Sonnet d’Anthropic dans Snowflake Cortex AI

Aujourd’hui, nous sommes heureux d’annoncer la disponibilité pour tous nos clients de Claude 3.5 Sonnet en tant que premier modèle de fondation Anthropic disponible dans Snowflake Cortex AI. Nos clients peuvent désormais accéder au modèle le plus intelligent de la famille de modèles Claude d’Anthropic à l'aide d'interfaces SQL, Python et prochainement d’API REST dans le périmètre de sécurité de Snowflake. Cette intégration native permet aux équipes de data et d’ingénierie de relever efficacement certains des défis les plus courants, selon l’enquête du MIT Technology Review Insights 2024, dans le déploiement de l’IA, y compris la gouvernance, la confidentialité et l’intégration des données.
Avec Sonnet 3.5 dans Cortex AI, les entreprises peuvent exploiter pleinement le potentiel de leurs données grâce aux assistants conversationnels et au traitement du langage à grande échelle. Les modèles de langage avancés de Claude amélioreront encore la façon dont les développeurs pourront créer des agents capables d'exécuter des analyses ad hoc, d'extraire des réponses de documents et d'autres bases de connaissances et d'exécuter d'autres flux de travail multi-étapes. Vous pouvez créer des applications dans le périmètre de sécurité de Snowflake avec les modèles à côté de vos données gouvernées. La facilité d’utilisation associée à un environnement fiable accélère la mise à disposition d’une IA adaptée aux entreprises.
Snowflake Cortex AI
Snowflake a lancé Cortex AI, une suite de fonctionnalités et de services intégrés qui incluent l’inférence de LLM entièrement gérée, le fine-tuning et la RAG pour les données structurées et non structurées, afin de permettre à ses clients d’analyser rapidement les données non structurées parallèlement à leurs données structurées et d’accélérer la création d’applications d’IA. La plateforme data et IA unifiée permet à de nombreuses entreprises de passer facilement du concept d’IA à la réalité en quelques jours. Les entreprises de toutes tailles et de tous secteurs peuvent désormais réaliser de nombreux cas d’usage, de la synthèse de textes à l’analyse des opinions en passant par le développement de chatbots d’IA puissants.
Claude 3.5 Sonnet
Claude 3.5 Sonnet est un modèle de fondation de la société de recherche et de sécurité en IA Anthropic. Le modèle élève la barre du secteur en matière d’intelligence, dépassant les modèles concurrents ainsi que Claude 3 Opus sur un large éventail d’évaluations, y compris un nouvel exploit selon SWE-bench, une évaluation en ingénierie logicielle. Claude 3.5 Sonnet excelle dans les benchmarks du secteur en matière de raisonnement de niveau supérieur (GPQA), de connaissances de premier cycle (MMLU) et de maîtrise du codage (HumanEval). Il montre également une nette amélioration dans la compréhension des nuances, de l’humour et des instructions complexes. Les capacités de raisonnement combinées aux performances rendent Claude 3.5 Sonnet idéal pour des tâches complexes telles que la fourniture d'une assistance client sensible au contexte et l'orchestration de flux de travail multi-étapes.

Pour nous, leader des CDP composables, l’IA générative est essentielle pour nous permettre d’extraire une valeur jusque-là inexploitée des données clients dans Snowflake. La possibilité d’accéder aux modèles Claude 3.5 d’Anthropic, leaders du secteur, au sein de Cortex AI signifie pour nous de pouvoir exploiter plus rapidement une valeur inédite pour nos clients communs, de manière sécurisée et gouvernée. Cette gouvernance unifiée des données et de l’IA nous permet d'agir rapidement, et de mieux servir nos clients avec l’IA. »
Jason Davis
Utiliser le modèle d’Anthropic dans Cortex AI
Grâce à Snowflake Cortex AI, il est facile d’accéder aux LLM. Vous n’avez pas à gérer les intégrations ; la gouvernance est cohérente entre les données et l’IA. Vous pouvez accéder aux modèles dans l'une des régions prises en charge. Vous pouvez également accéder à d’autres régions avec l’inférence interrégionale activée.

Vous pouvez accéder rapidement au modèle sur Cortex Playground, accessible via l’onglet AI/ML Studio, pour tester les prompts et évaluer différentes configurations d’inférence. Vous pouvez également comparer des modèles, analyser les variations de réponse avec différents paramètres et permettre à Cortex Guard de filtrer les réponses potentiellement inappropriées ou dangereuses.
SQL et Python
Le modèle peut être intégré dans un pipeline de données ou une application Streamlit in Snowflake pour traiter plusieurs lignes d’une table. La fonction COMPLETE, accessible en SQL et Python, peut être utilisée pour cette intégration. Vous pouvez également accéder aux modèles Claude à partir d’un Snowflake Notebook ou de l’IDE de votre choix en utilisant OAuth pour les clients personnalisés.
SELECT SNOWFLAKE.CORTEX.COMPLETE('claude-3-5-sonnet', CONCAT(‘Summarize this customer feedback in bullet points: <feedback>', content, '</feedback>');
Accédez à des modèles supplémentaires et à des détails sur l’utilisation de la fonction SQL ici ou apprenez-en davantage sur la syntaxe dans Python ici.
API REST (prochainement)
Pour permettre à des services ou des applications s’exécutant en dehors de Snowflake de faire des appels d’inférence à faible latence vers Cortex AI, l’interface API REST est la solution idéale. Voici un exemple de ce à quoi cela ressemble :
curl -X POST \
"model": "claude-3-5-sonnet",
"messages": [
{
"content": "Summarize this customer feedback in bullet points: <feedback>”
}
],
"top_p": 0,
"temperature": 0
}' \
https://<account_identifier>.snowflakecomputing.com/api/v2/cortex/inference:complete
Premiers pas : créer une application de recherche documentaire basée sur la RAG
Claude 3.5 Sonnet dans Cortex AI facilite la création d’applications aux côtés de vos données avec d’autres fonctionnalités telles que Streamlit (développement frontend en Python) et Cortex Search (moteur RAG avec génération d’intégration intégrée, gestion vectorielle et recherche hybride).
La suite pour Anthropic et Snowflake
Avec la disponibilité de Claude dans Cortex AI, les produits d’IA agentique de Snowflake, dont Snowflake Intelligence (bientôt en private preview) et Cortex Analyst (en public preview), prévoient d’exploiter Claude comme l’un des principaux LLM. Plus de détails à venir.
Grâce à la fenêtre contextuelle étendue et à la précision de pointe de Claude, les entreprises peuvent créer en toute confiance des applications d'IA stratégiques qui offrent des réponses plus fiables et plus précises sur l'ensemble de leurs données. Nous sommes impatients de découvrir les applications que vous développerez sur l’AI Data Cloud avec Claude Sonnet !
Pour en savoir plus sur l’IA générative dans Snowflake et les cas d’usage que vous pouvez créer, rejoignez-nous pour le Gen AI Day le 22 janvier.
À noter : cet article contient des déclarations prévisionnelles, notamment de futures offres de produits. Il ne constitue en aucun cas un engagement à fournir des offres de produits. Les offres et résultats réels peuvent varier et faire l’objet de risques connus et inconnus, ainsi que d’incertitudes. Découvrez notre dernier 10‑Q pour en savoir plus.