Em alta, ‘cientista de dados’ é profissão de futuro

Mais do que conhecimento em estatística, matemática e TI, profissional reúne a habilidade de encontrar uma agulha no palheiro

1357

Uma adolescente vai ao supermercado e, ao passar no caixa, recebe um folheto informativo sobre gravidez. Ela ainda não sabe, mas, a partir da listagem de produtos comprados, foi identificada a probabilidade de gestação, confirmada semanas depois. Como chegaram ao resultado? Por meio do somatório de tecnologia, análise e, claro, o trabalho de um… cientista de dados.

Nos últimos meses, a carreira despontou como uma das mais promissoras em tecnologia da informação, especialmente com a explosão do Big Data, termo usado para descrever a grande quantidade de dados que precisa ser analisada para apoiar as tomadas de decisão. Já é considerada por analistas do mercado a profissão do futuro. A previsão de dobrar o volume de dados a cada dois anos e o salto de Hadoop [projetado para uso intensivo de dados] tem impulsionado a importância desse talento.

“Em meio a uma montanha de dados, o cientista de dados deve localizar padrões e identificar insights, fornecendo subsídios para que empresas identifiquem o melhor caminho para conduzir os negócios e conquistar diferencial competitivo”, explica Pedro Desouza, cientista de dados da EMC, que há 20 anos trabalha no segmento.

É como encontrar uma agulha no palheiro. “Cientista de dados é aquele que, normalmente, tem formação em Ciência da Computação, Matemática e Estatística com conhecimentos profundos nessas áreas. Mais do que isso, ele entende de negócios”, descreve Desouza. É ainda alguém curioso, que gosta de resolver problemas e não tem medo de errar e se comunicar.

Explicar a aplicação dos resultados matemáticos na linguagem dos negócios é vital nessa profissão. “Existem pessoas altamente técnicas que falham em não se preocupar com esse ponto. Aquele que adota essa postura, rapidamente, vai parar no terceiro subsolo do prédio”, brinca. Saber extrair informação de um banco de dados também faz parte da lista de um bom profissional da área.

Cientista de dados é diferente de um estatístico. “Um estatístico não manipula dados. Ele os recebe em um arquivo e não participa do caminho anterior. O cientista tem conhecimento fim a fim, desde a fonte até o produto final”, esclarece.

De fato, prossegue o executivo, encontrar um profissional que reúna características tão particulares não é tarefa fácil. “Levando em conta que a demanda por cientistas de dados é latente e cresce, esse sujeito começa a ficar raro”, assinala. Não por acaso, seu salário gira em torno de seis dígitos nos Estados Unidos.

Esse quadro tem levado a uma inflação do mercado, observa. “A busca é tão alta que pessoas que trabalham em campos relacionados inserem em seus currículos palavras-chave como ‘Hadoop’, ‘Big Data’, para atrair a atenção das empresas, mesmo sem o conhecimento necessário”, explica.

Desouza enfrenta esse desafio na hora de contratar. “Para driblar, busco sólido embasamento estatístico e matemático, experiência em desenvolvimento Java, algoritmos estatísticos e PhDs.” Ele diz que uma das estratégias que tem adotado é localizar esses profissionais em conferências técnicas de alto nível. “Contratei dois dessa forma.”

Para companhias que querem fisgar esse especialista, ele recomenda a ajuda de uma consultoria. Isso porque, segundo ele, é preciso, em primeiro lugar, desenvolver uma cultura analítica. “Além disso, ainda há dúvidas sobre para quem o cientista de dados vai se reportar: para o CEO? Ele estará posicionado na estrutura de negócios ou TI?”, questiona.

Além da sala de aula

Desouza reuniu as competências necessárias ao longo do tempo por meio do acúmulo de experiência. “O volume de conhecimento é crítico e o grande desafio da profissão. Não se aprende com um único curso”, observa. O executivo, por exemplo, formou-se em 1985 no Instituto Tecnológico da Aeronáutica (ITA) e partiu para o mestrado em seguida, também no ITA, e doutorado na Carnegie Mellon University (CMU), em Pittsburgh, nos Estados Unidos, país que mora até hoje.

O tema de sua especialização foi o primeiro passo para que ingressasse na área. “Optei por abordar a otimização de problemas de grande porte. A complexidade me chamou a atenção”, diz. “Esse desafio passou a ter valor de negócios, abrindo oportunidades no mundo corporativo”, completa.

Atuou na IBM, BusinessObjects, Qualcomm e lidera, desde o início de 2011, na área de consultoria da EMC, uma equipe de 15 PhDs, que têm formação em matemática e estatística com conhecimento de indústrias. “Temos contratos com grandes clientes, especialmente em setores como varejo, finanças, companhias aéreas, internet e energia que querem tirar conhecimento de ‘caixas’ para reduzir custos e serem mais efetivos em suas estratégias”, aponta.

Estar em linha com o que há de novo na literatura fez a diferença em sua trajetória. “Muitos departamentos de pesquisa realizam estudos na área. É preciso ver o que é publicado nos jornais científicos, misturar com os requerimentos do cliente e adaptar os algoritmos para atender às necessidades”, afirma.

E como funciona o dia a dia do cientista de dados? Na área de consultoria, diz, tudo começa com um bate-papo com o cliente para entendimento dos processos. “Depois, pedimos acesso ao banco de dados. Não queremos que eles nos forneçam os dados, porque pode haver uma filtragem e eliminação de informações que podem ser importantes”, explica.

Diante de terrabytes de dados, o profissional deve aplicar algoritmos, analisar e fazer descobertas. “A busca começa no escuro, já que o universo é baseado em algoritmos probabilísticos, então, não tem uma resposta correta para o problema”, observa.

Mas a natureza do Big Data ajuda a ser mais assertivo. “É diferente da estatística pura e por isso não generaliza. É possível entender o padrão de consumo de um usuário e não mais de um grupo”, explica. Ele aponta que a tecnologia é fundamental nesse processo, porque análise e modelo estatístico são somente a ponta do iceberg.

Ele cita a aplicação do conceito na área de saúde. Por exemplo, um médico recomenda uma cirurgia para um paciente em determinadas condições e ele pede autorização para o plano, a combinação tecnologia + análise + atuação do cientista de dados em tempo real pode alertar o médico se ele realmente quer partir para o procedimento, levando em conta que naquelas condições, 70% de seus colegas sugerem outros exames. “A TI tem enorme potencial do ponto de vista humano”, conclui.

Fonte: IDG NOW!