Quando se fala em aprendizado de máquina, supõe-se que a máquina “aprende” algo, mas como ela faz isso? São duas as formas mais populares: aprendizado supervisionado e não-supervisionado.
No supervisionado indica-se para a máquina o que ela precisa descobrir, enquanto no não-supervisionado nem nós sabemos o que ela vai descobrir.
Aprendizado supervisionado
Podemos dizer que no aprendizado supervisionado somos como professores para a máquina, dizemos por onde começar (dados) e indicamos onde ela deve chegar (classe alvo), por meio dessas informações ela vai descobrindo quais são os melhores caminhos que levam de um ponto ao outro, usando como principais ferramentas regras matemáticas/lógicas.
Na minha atividade atual, por exemplo, tenho uma tarefa de classificação. Preciso ensinar o computador a descobrir qual a intenção de uma determinada frase. Indico para a máquina uma série de frases e as intenções correspondentes: para a sentença “Olá” a intenção é “INICIAR_CONVERSA”, para a sentença “Quero aumentar meu limite” a intenção é de “AUMENTO_DE_LIMITE”.
Dessa forma, a máquina vai descobrindo padrões entre as sentenças e as intenções, possibilitando que ela consiga, após bastante treino, dizer qual a intenção de uma frase totalmente nova.
Aprendizado não-supervisionado
O aprendizado não-supervisionado descobre padrões de outra forma. A máquina vai tentando “associar os dados com eles mesmos”, sem ter um alvo ou objetivo claro, por isso, quando finalizada uma tarefa com esse tipo de aprendizado, é necessária a interpretação humana, para entender o que a máquina fez.
Um exemplo é a geração dos grupos no nosso relatório de curadoria, no qual se compara as mensagens com elas mesmas, e por meio de uma métrica de similaridade, descobre-se quais sentenças se aproximam mais, em significado, de outras, e dessa forma grupos são criados.
Todavia não há indicação do que esses grupos de palavras significam ou indicam, é necessário que alguém observe-as e descubra qual foi o padrão descoberto pela máquina.
Os aprendizados, supervisionado e não-supervisionado, abrangem algumas das tarefas mais realizadas dentro da área de aprendizado de máquina, dentre elas classificação, regressão e agrupamento (que serão abordadas em outros laboratórios).
Mas é importante ressaltar que existem outras formas de aprendizado, como o aprendizado por reforço, muito utilizado em jogos, onde a máquina vai se aperfeiçoando em uma tarefa por meio de recompensas para acertos e penalidades para erros.
Por Otávio Parraga, desenvolvedor do #TimeUbots.