Para startups - Como incorporar algoritmos de aprendizado de máquina
![]() |
| https://www.flickr.com/photos/erikcharlton/2955613283 |
Como uma
equipe de arquitetura que desenvolve soluções para muitas startups,
frequentemente nos perguntam como incorporar algoritmos de aprendizado de
máquina em nosso produto. A questão vem principalmente de fundadores de
startups que estão ansiosos para diferenciar seu produto incorporando
aprendizado de máquina no início do ciclo de desenvolvimento do produto.
Para uma
inicialização, não há um grande conjunto de dados disponíveis no início para
treinar os modelos de aprendizado de máquina. No entanto, o algoritmo de
aprendizado de máquina é efetivo somente quando você usa um modelo treinado nos
dados especificamente relacionados aos usuários.
Aqui
estão as diferentes maneiras pelas quais as startups podem preencher lentamente
a lacuna entre o desenvolvimento de um produto que funciona bem com usuários
iniciais e a falta de dados grandes para desenvolver uma solução totalmente
amadurecida que use algoritmos de aprendizado de máquina com modelos treinados
com grandes dados reunidos durante um período de tempo.
- Faça perguntas curtas, mas relevantes, ao usuário em seu aplicativo ou portal. Use-os para criar o perfil do usuário e fornecer personalização.
- Capture a localização do usuário, os dados do dispositivo e outros dados de contexto em seu aplicativo ou portal e adicione-os ao perfil do usuário.
- Capture o comportamento do usuário no aplicativo e o alimente de volta em seu mecanismo de personalização para enriquecer o perfil inicial.
- Use o mecanismo de regras para correlacionar diferentes valores de perfil, sua ponderação e classificar os usuários com base na saída do mecanismo de regras.
- Use expressões regulares e dicionários de pesquisa para interpretar o texto livre para o entendimento da linguagem natural.
- Usar abordagem híbrida para interpretação de texto: algumas bibliotecas de processamento de linguagem natural como a PNL de Stanford fornecem parte das tags de fala (POS) e de reconhecimento de entidade (NER) que você pode usar na expressão regular junto com o texto para fornecer interpretação rica de texto.
- Limite a interpretação de dados não estruturados com base em outros dados estruturados relacionados.
- Marcar dados com base em regras ou expressões regulares.
- Fornecer maneiras de o usuário marcar manualmente os dados (texto) em seu aplicativo.
- Use dados marcados usando métodos tradicionais para treinar modelos ML.
- Aproveitando os dados adquiridos através de seus produtos no mercado.
- Copie dados relevantes de fontes na Web e use-os para treinar modelos ML.
- Gere dados sintéticos programaticamente e use-o para treinar os modelos: O sucesso deste método depende de quão perto você pode gerar dados sintéticos para dados reais com toda a aleatoriedade e distribuições e deve ser escolhido com cuidado.
- Escolha uma pilha de tecnologia como o Apache Spark, o Flink, que fornece bibliotecas para executar algoritmos ML em escala: você pode inicialmente executar programas de regras ou procedimentos em escala dentro dessas estruturas até que dados suficientes sejam reunidos para treinar modelos ML. Você pode então introduzir algoritmos ML dentro das mesmas estruturas sem precisar escolher outra pilha.
Certifique-se
de capturar todos os dados brutos desde o início. Quando você tiver dados
suficientes, use-os para treinar seus modelos de inclinação supervisionados e
você estará no caminho certo para aproveitar os algoritmos de aprendizado de
máquina do seu produto.
丨Quais outras técnicas você
utilizou em seus produtos nos estágios iniciais sem acesso a grandes quantidades de dados para personalização ou entendimento da linguagem natural?
|
| Não desejo receber esse tipo de e-mail |

















Post a Comment