O OpenAI lança o Healthbench, um conjunto de dados que compara modelos de IA de saúde de saúde

4 lido 1 minuto

OpenAI, o criador de inteligência artificial chatbot chatgpt, tem um Novo modelo de idioma grande de código aberto chamado Healthbench Isso permite que o setor de saúde realize os modelos de IA, informou a empresa em uma postagem no blog na segunda -feira.

O modelo foi construído em parceria com 262 médicos em 60 países e possui 5.000 conversas realistas de saúde assadas. O objetivo do Healthbench é descobrir se os modelos de IA estão dando as melhores respostas possíveis às perguntas relacionadas à saúde das pessoas. Cada resposta é medida contra um critério de rubrica escrito pelo médico, com cada critério ponderado para corresponder ao julgamento do médico. A rubrica é pontuada pelo GPT-4.1.

O modelo de raciocínio da Open Open tem o melhor desempenho, de acordo com a Healthbench, com uma pontuação de 60%, seguida pelo GROK de Elon Musk a 54%e pelo Gemini 2,5 Pro do Google em 52%.

Em um exemplo no post do Openai, ele postula um cenário em que um vizinho de 70 anos está deitado no chão, respirando, mas sem resposta. A pessoa pergunta a IA o que deve ser feito. Um modelo então fornece uma resposta com etapas sobre o que fazer, como chamar serviços de emergência, verificar a respiração e posicionar as vias aéreas. O Healthbench então obtém a resposta, explicando o que o modelo respondeu corretamente e o que poderia ser melhorado. Em seguida, fornece uma pontuação final, neste caso, 77%.

O modelo pode lidar com 49 idiomas, incluindo amárico e nepalês, e inclui 26 especialidades médicas, como cirurgia neurológica e oftalmologia.

O Openai não respondeu imediatamente a um pedido de comentário.

Fonte

Samara Souza 4 semanas atrás

4 lido 1 minuto

O OpenAI lança o Healthbench, um conjunto de dados que compara modelos de IA de saúde de saúde

Samara Souza

Análise e resultados ao vivo do UFC 316: Merab Dvalishvili vs. Sean O’Malley 2; Julianna Peña vs. Kayla Harrison

Mel B e Eddie Murphy ‘Compreensão’ enquanto seu filho anjo muda de pronomes para ‘ele/ele’

Assista: Inglaterra contra Índias Ocidentais, terceiros destaques do ODI

Pale Rider de Clint Eastwood tem muito em comum com este clássico ocidental

A equipe de Deepika Padukone com Atlee, Allu Arjun em AA22 X A6 Sparks comparações com sua saída do espírito de Sandeep Reddy Vanga

Análise e resultados ao vivo do UFC 316: Merab Dvalishvili vs. Sean O’Malley 2; Julianna Peña vs. Kayla Harrison

2024: Um Ano Melhor para Financiar Veículos? Especialistas Analisam Queda nos Juros e Maior Acesso ao Crédito

Guia Completo de Episódios e Arcos de One Piece: Saiba a Melhor Ordem para Assistir

Besouro Azul: Um Herói da DC Comics com uma História Fascinante

Huawei enfrenta diminuição no entusiasmo pelo Mate 70, dizem analistas

HBO Max agora disponível no Prime Video Channels: Uma parceria que amplia o acesso ao entretenimento

Hospital Geral 12 de maio Recapitulação de episódios: Jason aprende sobre as intenções de Sonny de vender seus cais para Sidwell; Deets

Plts sinal não elaborado agente livre Mose Vavao

Artigos Relacionados

Análise e resultados ao vivo do UFC 316: Merab Dvalishvili vs. Sean O’Malley 2; Julianna Peña vs. Kayla Harrison

2024: Um Ano Melhor para Financiar Veículos? Especialistas Analisam Queda nos Juros e Maior Acesso ao Crédito

Guia Completo de Episódios e Arcos de One Piece: Saiba a Melhor Ordem para Assistir

Besouro Azul: Um Herói da DC Comics com uma História Fascinante

Huawei enfrenta diminuição no entusiasmo pelo Mate 70, dizem analistas

HBO Max agora disponível no Prime Video Channels: Uma parceria que amplia o acesso ao entretenimento