Licenciatura

Engenharia Informática

Área Científica

Ciências Informáticas

Duração

Semestral

Unidade Curricular

Ciência de Dados

ECTS

6

Horas de Contacto Teórico Práticas

60h

OBJETIVOS DA APRENDIZAGEM

Para concluir com sucesso esta unidade curricular, os alunos deverão demonstrar possuir os seguintes conhecimentos e capacidades:

1. Saber instalar e administrar o sistema de bases de dados relacionais SQL Server;
2. Saber instalar e administrar o sistema de gestão de bases de dados relacionais MySQL para grandes volumes de informação;
3. Criar e aceder a bases de dados de grande dimensão e conteúdo em MySQL;
4. Saber instalar e administrar o sistema de bases de dados documentais MongoDB para Big Data;
5. Saber utilizar o MongoDB num contexto de grande volume de dados;
6. Saber instalar e administrar o sistema de bases de dados documentais Neo4j para dados de grande volume e dimensão;
7. Compreender o modelo de dados e saber criar e aceder a bases de dados em Neo4j que armazenem dimensões volumosas de informação;
8. Compreender Técnicas de Data Mining associadas a Big Data.

PROGRAMA

1. SGBDR SQL Server

1.1. Análise do sistema SQL Server

1.2. Implementação de bases de dados em SQL Server

1.3. Administração de bases de dados em SQL Server

1.4. Projeto prático usando SQL Server

2. MongoDB

2.1. Análise do sistema MongoDB

2.2. Implementação de bases de dados em MongoDB

2.3. Administração de bases de dados em MongoDB

2.4. Projeto prático usando MongoDB

3. Neo4js

3.1. Análise do sistema Neo4j

3.2. Implementação de bases em Neo4j

3.3. Administração de bases de dados em Neo4j

3.4. Projeto prático usando Neo4j

4. Data Mining

4.1. O processo de data Mining

4.2. CRISP-DM (Cross-Industry Standard Processs for Data Mining)

4.3. Outras tecnologias de Data Mining

4.4. Tarefas de Data Mining

4.5. Classificação

4.6. Segmentação ou Agrupamento

4.7. Estimação ou Regressão

4.8. Associação ou Modelação de dependências

4.9. Técnicas de Data Mining

4.9.1 Árvores de decisão

4.9.2. Regressão Linear

DEMONSTRAÇÃO DE COERÊNCIA ENTRE CONTEÚDOS PROGRAMÁTICOS E RESULTADOS DA APRENDIZAGEM

Os objetivos 1, 2 e 3 são alcançados através dos pontos 1.1 a 1.4 do programa. Os pontos 2.1 a 2.4 permitem concretizar os objetivos 4 e 5. Os objetivos 5 e 6 são concretizados através dos pontos 3 e 4.

METODOLOGIA DE ENSINO E AVALIAÇÃO

A metodologia utilizada nesta unidade curricular é baseada na utilização prática de diversos sistemas de software e no desenvolvimento de projetos que envolvem a criação de bases de dados nas diferentes plataformas de gestão de bases de dados relacionais e não relacionais.

De acordo com o Regulamento de Funcionamento do ISTEC a avaliação é efetuada através de um exame escrito individual e obrigatório. Na classificação final, poderão ser considerados elementos de avaliação contínua, tais como testes, trabalhos individuais ou em grupo, assim como a participação nas aulas presenciais e em recursos de aprendizagem proporcionados por sistemas de e-learning.

DEMONSTRAÇÃO DE COERÊNCIA ENTRE METODOLOGIAS DE ENSINO E RESULTADOS DE APRENDIZAGEM

A componente teórico-prática das aulas e os projetos a desenvolver para cada sistema de gestão de bases de dados, asseguram que os objetivos definidos para esta unidade curricular, e que fundamentalmente consistem em familiarizar os alunos com a utilização de diferentes sistemas de gestão de bases de dados, e as respetivas características das diferentes bases de dados. Alcançando-se assim os objetivos desejados.

BIBLIOGRAFIA

Fundamental:

B. Gomez,(2020) “Resolviendo problemas de Big Data”, Alfaomega.

D. Insua, (2019)“Big data: Conceptos, tecnologías y aplicaciones”, CSIC.

H. Jones, (2019)“Analítica de datos”, HJ,.

J. Somed, (2020)“Big Data Analytics”, JLC.

Complementar:

B. Marr, (2016)“BIG DATA: La utilización del Big Data, el análisis y los parámetros SMART para tomar mejores decisiones y aumentar el rendimiento”, TEEL.

Connolly, Thomas & Begg, Carolyn. (2015). Database Systems: A Practical Approach to Design, Implementation, and Management, 6th Edition. Editor: Pearson

Gaspar, Drazena, Coric, Ivica, (2017) Bridging Relational and NoSQL Databases, IGI Global
Lal, Mahesh Neo4j, Graph Data Modeling (2015), Packt Publishing

I. Diaz,(2017) “Big Data para CEOs y Directores de Marketing” IGD.

N. Marz,(2015) “Big Data: Principles and best practices of scalable realtime data systems”, Manning.

M. Kleppman,(2016) “Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems”, M. K.,.

Nenad, Jukic, Vrbsky, Susan & Nestorov, Svetlozar. (2014). Database Systems: Introduction to Databases and Data Warehouses. Editor: Pearson.

Santos, M., & Azevedo, C. (2005). Data Mining: Descoberta de Conhecimento em Bases de Dados. Lisboa: FCA.

INTERNET:
Acesso a publicações da especialidade, gratuitamente, através da rede SPRINGER:
https://link.springer.com/