Conheça ‘DarkBERT:’ Atuando na Dark Web com Inteligência Artificial para combater o cibercrime

A nova IA foi treinada vasculhando a “Dark Web”.

#Inteligência Artificial 

Uma equipe de pesquisadores da Coreia do Sul desenvolveu um novo LLM chamado “DarkBert”, que foi treinado exclusivamente na “Dark Web”.

Uma equipe de pesquisadores sul-coreanos deu o passo sem precedentes de desenvolver e treinar inteligência artificial (IA) na chamada “Dark Web”. A IA treinada na Dark Web, chamada DarkBERT, foi lançada para rastrear e indexar o que poderia encontrar para ajudar a esclarecer as formas de combater o cibercrime.

A “Dark Web” é uma seção da Internet que permanece oculta e não pode ser acessada por meio de navegadores padrão. Essa parte da web é famosa por seus sites e mercados anônimos que facilitam atividades ilegais, como comércio de drogas e armas, venda de dados roubados e um refúgio para criminosos cibernéticos.

A ‘Dark Web’ emprega sistemas complexos que mascaram o endereço IP de seus usuários, dificultando o rastreamento dos sites visitados. O acesso a esta seção da web requer um software especializado, o mais popular deles é o Tor (The Onion Router). O Tor é usado por aproximadamente 2,5 milhões de pessoas todos os dias.

Com o surgimento de programas de processamento de linguagem natural como o ChatGPT, essa tecnologia é cada vez mais usada como um novo tipo de crime cibernético. Ao desenvolver uma IA que pode combater fogo com fogo, os pesquisadores queriam descobrir como os modelos de linguagem grandes (LLM) poderiam ajudar.

Para esse fim, os pesquisadores publicaram um artigo intitulado “DarkBERT: um modelo de linguagem para o lado negro da Internet” sobre suas descobertas. Eles conectaram seu modelo à rede Tor e coletaram dados brutos para criar um banco de dados. No entanto, o artigo ainda não foi revisado por pares.

De acordo com a equipe, seu LLM foi muito melhor em entender a dark web do que outros modelos treinados para concluir tarefas semelhantes, incluindo RoBERTa, que os pesquisadores do Facebook projetaram em 2019 para “prever seções de texto intencionalmente ocultas em linguagem não anotada”. exemplos”, de acordo com uma descrição oficial.

“Nossos resultados de avaliação mostram que o modelo de classificação baseado em DarkBERT supera o de modelos de linguagem pré-treinados conhecidos”, escreveram os pesquisadores em seu artigo.

De acordo com a equipe, o DarkBERT tem potencial para ser empregado para diversos fins de segurança cibernética, incluindo a identificação de sites que vendem ransomware ou liberam dados confidenciais. Além disso, ele pode vasculhar os inúmeros fóruns da dark web atualizados diariamente e ficar de olho em qualquer troca ilegal de informações.


Publicado em 30/05/2023 22h32

Artigo original:

Link original: