EDB II

UNIDAD II

Base de Datos Relacionales

1.- Estructura de las Bases de Datos Relacionales

Es la estructura más utilizada actualmente. En ella los datos están estructurados en tablas:

- Cada fila es un registro o entidad.
- Cada columna es un campo de ese registro.

Esta estructura es similar al concepto matemático de relación, por ello ha tenido tanto auge, ya que todas las teorías y reglas matemáticas sobre relaciones son aplicables, lo que hace que sea fácil de formalizar.

A la tabla se le llama relación, y a cada fila tupla; a cada columna de una tupla se le llama atributo, es en esto en lo que se diferencia del modelo matemático.

Convencionalismos

Los nombres de relaciones siempre en minúsculas.

Cada tupla se puede representar por una variable de tupla.

Cada atributo se representa por su nombre.

Cardinalidad = Nº de tuplas de una relación.

Grado = Nº de atributos de la relación.

Cada atributo puede tomar valores dentro de su dominio de atributo (Conjunto de valores posibles)

El esquema de una relación se representa en letras mayúsculas: r(R) donde r sería el nombre de la relación y R el nombre del esquema.

Formato de un esquema: Nom_esquema=(lista de atributos con sus dominios).

Ejemplo: Alumnos = (dni: dom_dni; nombre: dom_nombre; edad: dom_edad).

Obsérvese que la primera letra de Alumnos es mayúscula (es un esquema).

Esquema = Definición global y general de una relación.
Instancia de una relación = Información que contiene una relación en un momento determinado.

2.- Propiedades de las Relaciones

Miden su grado de bondad/aproximación al modelo real matemático por una serie de "formas normales", según se sube en las formas se dice que la relación está mejor diseñada. Al menos debe estar en la primera forma normal (1NF) y para ello debe cumplir:

No hay duplicación de tuplas.

No hay orden entre las tuplas.

No hay orden entre los atributos (se accede a través de su nombre).

No existen atributos que no sean atómicos (una casilla un dato). Es decir, no existe la posibilidad de tener una tabla como la siguiente:

Alumno	Asignatura
José	Cálculo
	Algebra
	Física

no es correcta, sin embargo si lo es esta otra:

Alumno	Asignatura
José	Cálculo
José	Algebra
José	Física

Por último, decir que existe la posibilidad de tratar relaciones entre sí a través de atributos comunes, esto evita la duplicación de la información. Dividimos un esquema en más de uno.

Ejemplo: Alumno = (nombre: dom_nombre; nº: entero)

Asignatura = (nº: entero; asignatura:dom_asignatura).

En este caso el campo común entre las relaciones es el campo nº:

Nombre	Núm.
José	15
Antonio	17
Pedro	18

Num.	Asignatura
15	Cálculo
15	Algebra
15	Física

3.- Claves en el Modelo Relacional

Debe existir un atributo o conjunto de atributos que identifique de un modo único a una tupla; a ese atributo se le llamaría superclave (puede ser el conjunto formado por todos los atributos), al menos hay uno siempre.

Para una r(M) diremos que un subconjunto de atributos (K) del esquema será clave de la relación si para toda tupla t₁ ≠ t₂ se cumple que t₁[k] ≠ t₂[k] (es decir, dadas dos tuplas diferentes el valor de la clave también lo es).

Dentro de las superclaves, llamaremos claves candidatas a las superclaves más pequeñas (aquellas superclaves que carecen de subconjuntos propios que sean también superclaves).De entre todas las que haya, es el usuario el que decide cual es la primaria, las demás se llaman alternativas.

Reglas de Integridad:

Integridad de Identidad: La clave primaria de una relación no puede contener valores nulos.

Integridad de Referencia: Cuando en una relación hay un atributo que hace referencia a una clave primaria de otra relación, el atributo debe tener un valor coincidente con alguno de la clave primaria o como mucho ser nulo (es decir, no puede tener un valor que no exista entre los valores de la clave primaria en la primera relación).

4.- Lenguajes de Consulta a Bases de Datos Relacionales

Los podemos dividir en dos tipos: Lenguajes Formales y Lenguajes Comerciales. Los lenguajes formales están basados en el álgebra relacional o en el cálculo relacional. Solamente se han descrito para consulta a Bases de Datos (existen lenguajes comerciales que además de consulta permiten otras operaciones).

El álgebra relacional tiene procedimientos (procedimental), mientras que los lenguajes basados en el cálculo relacional son aprocedimentales. Dentro del cálculo relacional se distingue entre cálculo relacional orientado a tuplas y cálculo relacional orientado a dominios.

Los lenguajes comerciales, en su mayoría usan enfoques tanto procedimentales como aprocedimentales, o lo que es lo mismo, no son lenguajes puros como los formales. De esta manera hacen su sintaxis más amigable al usuario.

4.1 Lenguajes Formales

Álgebra Relacional

A) Operaciones fundamentales: Tiene cinco por medio de las cuales se puede realizar cualquier consulta. Son las siguientes:

1.- Selección (σ). Es una operación unaria (actúa sobre una relación única). Sirve para obtener determinadas tuplas de una relación, basándose en que dichas tuplas cumplan un predicado determinado P. Su sintaxis es la siguiente: σ_P (r), donde r es la relación sobre la que se actúa y P es el predicado que debe cumplirse.

Si por ejemplo tenemos la relación: estudiante = (NE, nombre, edad, dccion) y queremos seleccionar al estudiante 2249 tendremos que hacer: σ _{NE
=2249}(estudiante)

El predicado de selección admite los siguientes operadores relacionales: < , ≤ , > , ≥ , = . Además un predicado puede estar compuesto por varias condiciones unidas por los conectivos ∧ u ∨. Ejemplo: σ _{nombre
= "Pepe" ∧ edad
> 25} (estudiante)

De esta manera se seleccionarían todos los estudiantes llamados Pepe y cuya edad supere los 25 años.

2.- Proyección (Π): Es también una operación unaria. Proyecta una nueva relación con un nuevo esquema en el cual aparezcan solamente los atributos que se especifican en la operación.

Sintaxis: Π _{A1
,..., An}(r). Donde A₁ ,...., A_n es la lista de atributos y "r" la relación sobre la que se actúa. Si, por ejemplo, queremos tener toda la relación de estudiantes, pero sólo con el nombre haríamos: Π_nombre (estudiante)

Si quisiésemos obtener el nombre del estudiante 224: Π_nombre (σ _{NE
= 2249}(estudiante))

3.- Producto Cartesiano (r₁x r₂): Si el número de tuplas de r₁ es n₁, y el número de tuplas de r₂ es n₂, el número de tuplas de la relación obtenida será n₁·n₂. Veamos un ejemplo: Supongamos que tenemos las siguientes relaciones:

Cliente = (nombre_cliente, ciudad, calle)

Sucursal = (nombre_sucursal, activo, ciudad)

Prestamo = (num_prestamo, nombre_sucursal, nombre_cliente, importe)

Deposito = (num_cuenta, nombre_sucursal, nombre_cliente, saldo)

Si realizamos el producto cliente x prestamo, el esquema sería la unión de los esquemas:

(cliente.nombre_cliente, ciudad, calle, num_prestamo, nombre_sucursal, prestamo.nombre_cliente, importe)

Como tuplas obtenemos las posibles combinaciones de tuplas de cliente con tuplas de prestamo.

Habrá muchas tuplas de la nueva relación en las que se cumplirá que: t[cliente.nombre_cliente] ≠ t[prestamo.nombre_cliente]

Por ello, normalmente la operación de producto cartesiano va unida a una selección que de entre todas las posibles combinaciones de tuplas selecciona las que cumplen unas condiciones. Por ejemplo, queremos localizar los clientes y las ciudades donde viven que tengan un préstamo.

Π _{prestamo.nombre_cliente, ciudad} (σ_{prestamo.nombre_cliente
= cliente.nombre_cliente} (cliente x prestamo))

4.- Unión de Conjuntos (r₁ ∪ r₂): Actúa sobre dos relaciones uniéndolas. El resultado es, por tanto, una nueva relación con el mismo esquema que las relaciones implicadas y con un número de tuplas que es la unión de las tuplas de r₁ y r₂ (los elementos duplicados se desechan).

r₁ y r₂ deben tener el mismo esquema, es decir, los dominios de los atributos i-ésimos de cada uno de los esquemas debe coincidir.

En el ejemplo que estamos considerando, no podríamos hacer la unión de cliente con préstamo, pero sí sería posible hacer esto otro por ejemplo

(Π _{nombre_cliente} (cliente)) ∪ (Π_{nombre_cliente} (prestamo)) Con la anterior operación obtendríamos los nombres de los clientes que tienen préstamo o no. En la práctica esta sería una operación inútil, puesto que se supone que todos los que tienen un préstamo en un banco son automáticamente clientes del banco. Veamos otra unión que sería de mayor utilidad: si queremos conocer los clientes que tienen en la sucursal 2 una cuenta, un préstamo, o ambas cosas, la operación a realizar sería:

(Π _{nombre_cliente}(σ_{nombre_sucursal
= "2"}(prestamo))) ∪ (Π_{nombre_cliente}(σ_{nombre_sucursal
= "2"}(deposito)))

5.- Diferencia de Conjuntos (r₁ - r₂): Es una operación binaria que da como resultado una relación con los elementos que están en r₁, y no están en r₂. Lógicamente r₁ y r₂ deben tener el mismo esquema.

Esta operación se podría utilizar, si por ejemplo queremos saber el nombre de los clientes que tienen un préstamo en la sucursal principal, pero que no tienen cuenta en dicha sucursal:

(Π_{nombre_cliente}(σ_{nombre_sucursal
= "Principal"} (prestamo))) - (Π _{nombre_cliente}(σ_{nombre_sucursal
= "Principal"}(deposito)))

Con las cinco operaciones definidas (operaciones fundamentales) se puede realizar cualquier consulta en álgebra relacional. Aun así, existen otras operaciones (operaciones adicionales), que facilitan algunos tipos de consulta frecuente, y que puede resultar muy tedioso el hacerlas mediante las operaciones fundamentales.

B) Operaciones Adicionales: 1.- Intersección de Conjuntos (r₁ ∩ r₂): Da como resultado una relación que contiene los elementos comunes a r₁y r₂. Es adicional, ya que es equivalente a realizar r₁ - (r₁ - r₂).

Por ejemplo, podríamos obtener los nombres de los clientes que tienen depósito y préstamo al mismo tiempo en la sucursal 10.

(Π _{nombre_cliente}(σ_{nombre_sucursal
= "10"} (prestamo))) ∩ (Π_{nombre_cliente}(σ_{nombre_sucursal
="10"}(deposito)))

6.- Unión Join o Producto Theta (r1 Θ _P r2): Es una forma de expresar un producto cartesiano que lleva implícita una selección. P representa el predicado de la selección. De esta manera, otra forma de conocer los nombres de los clientes que tienen préstamo, cuenta o ambas cosas en la sucursal 10 sería:

(Π_{nombre_cliente}(σ_{nombre_sucursal
= "10"}(prestamo))) Θ _{prestamo.nombre_cliente
= deposito.nombre_cliente}(Π_{nombre_cliente}(σ_{nombre_sucursal
= "10"} (deposito)))

Otra forma de conseguir esto mismo sería:

Π_{prestamo.nombre_cliente}(prestamo Θ_{prestamo.nombre_cliente
= deposito.nombre_cliente ∧}deposito) _{prestamo.nombre_sucursal = "10" ∧

deposito.nombre_sucursal = "10"}

Podemos afirmar que:

r₁ Θ _P r₂ = σ_P (r₁ x r₂)

7.- Producto Natural (r₁ r₂): Mejora la operación anterior, devolviendo directamente las tuplas que tienen atributos comunes. En otras palabras, realiza la proyección sobre la unión de los esquemas, es decir, elimina uno de los atributos comunes a ambas relaciones y selecciona aquellas tuplas cuyos atributos comunes coinciden en valor.

El siguiente ejemplo devuelve una relación con los nombres de los clientes que tienen préstamo, depósito o ambas cosas en la sucursal 10.

Π _{nombre_cliente}(σ_{nombre_sucursal
= "10"} (prestamoℵdeposito))

Dados r₁(R₁) y r₂(R₂) dos relaciones con sus respectivos esquemas, se cumple la siguiente igualdad:

r₁ ℵr₂ = Π_{R1 ∪ R2} (σ_{r1.A1
=r2.A1 ∪ .........∪ r1.An = r2.An} (r₁ x r₂))

Al ser unión de esquemas, como los elementos de los esquemas son los nombres de los atributos, si existe una columna común a R₁ y R₂sólo aparecerá una vez.