Dados Estruturados e Não-Estruturados

Saiba neste artigo o que são Dados Estruturados e Dados Não Estruturados, para a disciplina de Tecnologia da Informação (TI).

Olá, Estrategistas. Tudo bem com vocês?

A disciplina de Tecnologia da Informação é um calo no sapato de quase todo concurseiro, não é mesmo?

Foi-se o tempo em que ela era cobrada apenas em concursos específicos da área de TI, sendo também agora exigida em diversos outros certames, como os das áreas fiscal e policial, entre outros.

Por não ser tão comum em concursos públicos, ela acaba se tornando um pouco complicada, uma vez que não está no dia a dia do estudante, diferentemente das disciplinas de Direito. Mas estamos aqui justamente para ajudá-los a entender melhor este tema.

O artigo de hoje é sobre alguns conceitos da Gestão da Informação, mais especificamente sobre os Dados Estruturados e Não Estruturados.

Dados Estruturados

Os dados estruturados são aqueles que são organizados através de uma estrutura rígida e previamente definida, dispostos em blocos semânticos, sendo frequentemente categorizados como quantitativos. Não entendeu? Vamos exemplificar.

Você já trabalhou com tabelas organizadas em linhas e colunas de bases de dados relacionais? Pois bem, caso elas tenham uma estrutura fixa, com o mesmo formato para todos os registros presentes nela, temos um conjunto de dados estruturados.

Suponhamos que uma tabela possua as colunas Nome, CPF, Endereço e Telefone, como podemos ver abaixo:

Dados Estruturados – Tabela

É possível perceber na tabela acima que todas as linhas presentes nela possuem valores padronizados, sendo cada um deles específico para cada uma das colunas. Por exemplo, em uma linha, haverá valores para as quatro colunas apresentadas, sendo que o CPF sempre será um número, assim como o telefone. Além disso, é possível exigir que os nomes possuam uma cadeia máxima de 40 caracteres, bem como o endereço. São esses tipos de características rígidas e fixas, previamente planejadas, que qualificam determinados dados como estruturados.

Caso seja necessário inserir outra coluna com uma outra característica, é plenamente possível, sendo imprescindível que antes de inserir novos valores, é necessário criar a nova coluna, com o seu novo atributo, sendo que esta ação não descaracteriza a tabela como sendo de estrutura fixa.

Uma grande vantagem destes tipos de dados é que eles podem ser manipulados e compreendidos por linguagens de máquina com certa facilidade e rapidez. Além disso, como já antecipado, é possível excluir e inserir novos dados, além de poder ordenar, agrupar e consultar dados e tabelas facilmente.

Dados Não Estruturados

Estes tipos de dados são exatamente o oposto dos estudados acima. Os dados não estruturados não são organizados de uma maneira previamente definida, além de não possuírem um formato antecipadamente determinado.

Diferentemente dos estruturados, os não estruturados não podem ser processados com facilidade por ferramentas convencionais, impossibilitando a produção de informações, uma vez que eles são frequentemente categorizados como qualitativos. Alguns exemplos são as imagens, vídeos, relatórios textuais, áudios, entre outros similares.

Imagine quando você está redigindo um documento no Microsoft Word. Geralmente não há nenhuma preocupação com limites ou restrições, sendo apenas inseridos textos de acordo com a vontade do usuário, bem como imagens ou gráficos, de modo não rígido. Por isso, habitualmente, documentos de textos são considerados dados não estruturados.

Em relação aos dados gerados atualmente, mais de oitenta por cento (80%) são considerados como não estruturados, devido ao rápido avanço da tecnologia, em que registros são criados a todo momento e, muitas vezes, de maneira desordenada.

Dados Semiestruturados

Os dados semiestruturados possuem características dos dois tipos de dados estudados acima. Desse modo, por não serem considerados pertencentes a nenhum dos extremos, ou seja, não são completamente estruturados nem totalmente não estruturados, estes tipos de dados possuem uma representação estrutural considerada heterogênea.

Eles possuem como característica a “Definição à Posteriori”, em que sua estrutura é geralmente definida após a existência dos dados, através da análise de seus esquemas particulares, identificando semelhanças e diferenças, já que o seu esquema, por muitas vezes, está inserido entre os próprios dados, de maneira implícita, sendo, por isso, conhecidos como autodescritivos.

Além disso, eles podem apresentar uma estrutura de dados evolucionária, já que ela pode se modificar sempre que os dados forem também modificados.

O exemplo clássico de dados semiestruturados são os dados escritos em XML (Linguagem de Marcação Extensível). Esta linguagem permite representar e manipular elementos em formato textual, de maneira que há informações que auxiliam a descrever os tipos dos dados textuais, juntamente com os próprios dados, não impedindo, também, que estruturas diferentes sejam implementadas posteriormente.

Comparação

Com todos as informações dispostos acima, podemos representar, de maneira didática, como é a organização de cada tipo de conceito citado neste artigo:

Comparação entre os tipos de dados

PARA FIXAR:

  • Dados Estruturados

Estrutura e organização rígidas previamente definidas;

Dados organizados em relações semânticas (tabelas), com os mesmos atributos para cada registro de dados;

Facilmente interpretados por linguagem de máquina;

Exemplo: banco de dados.

  • Dados Não Estruturados

Não possuem estrutura e formato previamente definidos;

Não são de fácil interpretação por ferramentas convencionais;

Representam a maioria dos dados corporativos gerados;

Exemplos: relatórios, vídeos, fotos e áudios.

  • Dados Semiestruturados

Representação Estrutural Heterogênea;

Definição de estrutura à posteriori (estrutura é geralmente definida após a existência e análise dos dados, pois pode estar implícita entre eles, sendo autodescritivos);

Exemplo: XML.

Questões

Vamos observar como este assunto é cobrado em provas? 

(TCE/PA – 2016) Em comparação aos dados não estruturados, os dados estruturados demandam mais espaço de armazenamento e um gerenciamento mais cauteloso, uma vez que constituem a maior parte dos dados corporativos.

ERRADO

Conforme explicado neste artigo, a grande maioria dos dados corporativos gerados atualmente, entre 80% e 90%, são não estruturados. Desse modo, eles necessitam de um maior espaço de armazenamento.

(TCE/PB – 2018) Dados não estruturados de um mesmo grupo possuem as mesmas descrições e, consequentemente, os mesmos atributos.

ERRADO

De acordo com o que estudamos, os dados não estruturados não possuem estrutura definida, não seguindo nenhum padrão de organização. A assertiva acima se refere aos estruturados.

(TCE/SC – 2016) Em se tratando de dados estruturados, a informação de esquema está mesclada aos valores dos dados, e cada objeto de dados pode ter atributos diferentes, que não são conhecidos com antecedência. Essa característica os diferencia dos não estruturados.

ERRADA

Conforme estudado, são os dados semiestruturados que podem possuir seus esquemas inseridos/mesclados dentro dos próprios dados, sendo autodescritivos.

Já os estruturados possuem um esquema predefinido e rígido, sendo, dessa maneira, conhecidos com antecedência.

Fonte: Estratégia Concursos