• Objetivos de la Unidad

      Entender las limitaciones de XML como modelo de datos semántico.

      Comprender lo que es un grafo de conocimiento y poder modelar una realidad utilizando RDFS.

                                                                                                                                                                                                                                                                                                           Construyendo la Web de Datos

      Relación de esta Unidad con lo que estudiamos en la Unidad anterior:

      En la unidad anterior repasamos los Modelos de Datos. Estudiamos XML Schema como modelo para validar tipos de documentos. Comparamos el Modelo Relacional y el Modelo Orientado a Objetos según el nivel de abstracción que ofrecen. Diferenciamos el nivel de abstracción que tienen los modelos de su capacidad de expresión. Recordemos que la capacidad de expresión está en relación con cuánta semántica del mundo real es capaz de representar el modelo. En esta unidad estudiaremos el modelo de Grafos de Conocimiento como uno de los modelos de mayor capacidad de expresión que XML. Nos interesa entender lo que es la Web Semántica, también llamada Web de Datos o Web 3.0. En la unidad anterior terminamos con un dibujo en capas de los elementos necesarios para la catalogación de libros en las bibliotecas en correspondencia con los elementos que hacen a la Web Semántica. En esta unidad profundizaremos en lo que significa la capa RDF de ese stack de tecnologías de la Web Semántica, identificando a RDF como un tipo de grafo de conocimientos.   

      Contenido de la Unidad

      Parte I: Modelos Semánticos

      1. ¿Qué limitaciones tiene XML para la Web de Datos? 

      2.  Grafos de Conocimientos (Knowledge Graphs)

                2.1 El panel de conocimientos de Google

                2.2 Características de un grafo de datos

                2.3 Diferencias entre un grafo de conocimientos y un grafo de datos

                2.4 Grafos de Conocimiento en el mundo real

      Parte II: RDF: un tipo de Grafo de Conocimientos

      1. ¿Cómo nombrar los datos en la Web? 

      2.  RDF: conceptos, sintaxis y semántica

                2.1 Definición del modelo abstracto de RDF

                2.2 RDF serializaciones

                2.3 Representando hechos simples con RDF

                2.4 RDF Schema/RDF vocabulario

                2.5 Inferencia en RDF

                2.6 Semántica de RDF


    • MATERIAL OBLIGATORIO PARTE I

    • Parte I: Modelos Semánticos

      1. ¿Qué limitaciones tiene XML para la Web de Datos? 

      2.  Grafos de Conocimientos (Knowledge Graphs)

                2.1 El panel de conocimientos de Google

                2.2 Características de un grafo de datos

                2.3 Diferencias entre un grafo de conocimientos y un grafo de datos

                2.4 Grafos de Conocimiento en el mundo real


      ¿De donde viene el nombre Modelos Semánticos?

      En la conferencia SIGMOD de 1978 aparece el  siguiente trabajo:

      The semantic data model: a modelling mechanism for data base applications

      Autores: Michael Hammer MIT Laboratory for Computer Science, Cambridge, MA
      Dennis McLeod MIT Laboratory for Computer Science, Cambridge, MA

      Publicado en:

                    Proceeding SIGMOD '78 Proceedings of the 1978 ACM SIGMOD international conference on management of data
                    Pages 26-36

       Su resumen dice: 

      Modelos de datos convencionales no son satisfactorios para el modelado de sistemas de aplicación de base de datos . Las características que se ofrecen son de nivel muy bajo para la representación de la semántica de una base de datos que se expresa directamente en el esquema. El modelo de datos semántico ( SDM ) ha sido diseñado como un mecanismo de modelado de aplicaciones natural que puede captar y expresar la estructura de un entorno de aplicación. Las características del SDM corresponden a las principales estructuras intencionales que ocurren naturalmente en las aplicaciones actuales de base de datos.  Además, las facilidades para expresar información  derivada (redundante ) son una parte esencial del SDM , la información derivada es tan prominente en un esquema  SDM como son los datos primitivos. El SDM está diseñado para mejorar la eficacia y la facilidad de uso de las bases de datos informatizadas. Puede servir como una especificación formal y mecanismo de documentación de la base de datos, puede soportar una variedad de poderosas instalaciones de la interfaz de usuario, y puede ser utilizado como una herramienta en el proceso de diseño de la base de datos.


      1. ¿Qué limitaciones tiene XML como Modelo Semántico de Datos?

      En la unidad anterior vimos lo que significa que un documento XML es válido con respecto a un documento XML esquema. Lo que el XML Schema controla es la ESTRUCTURA del documento XML. En la actividad grupal se pedía crear instancias válidas para el documento XML Schema que representa la estructura acordada entre el emisor y el receptor de la información. La pregunta que nos inquieta ahora es ¿cuál es la SEMANTICA que podemos interpretar de un documento XML?



      Antes de continuar realiza la ACTIVIDAD INDIVIDUAL 1: ¿ Qué nos dice un documento XML?



    • No olvides seleccionar el botón "terminar" y el botón "terminar revisión" cuando  tengas completa la actividad.

    • Si realizaste la actividad AI1 en las conclusiones encuentras las dos grandes limitaciones de XML.

      Por supuesto, XML es a pesar de estas limitaciones uno de los pilares de la Web Semántica.

      XML tiene muchas características que lo hacen fundamental para su uso en la Web. Entre ellas podemos destacar que facilita el intercambio de información entre fuentes tecnologicamente heterogéneas y es facil de entender tanto por humanos como por mas máquinas. Su aplicación fundamental es la representación estructural de los datos y la fácil distribución de los mismos. Otras cualidades destacables de XML es que existen complementos como XQuery, Xpath, XSLT y XML Schema (XSD) para consultar, navegar, transformar y validar los datos representados en un documento XML.

      Un ejemplo para mostrar este potencial podría ser el de dos instituciones médicas A y B con sistemas tecnologicamente diferentes que intercambian información de sus afiliados cuyos datos son almacenados en bases de datos heterogéneas. En este caso, la institución A puede solicitar los datos de los nuevos afiliados a partir de una fecha determinada a un servicio expuesto por la institución B el cual recupera de su base local los registros de sus afiliados, los serializa en un documento XML y los devuelve a la institución A. Luego la institución A puede validar la consistencia del documento usando un archivo de definición de esquemas XML Schema, y en caso de ser correcto procesarlo usando XQuery y XPath para luego persistirlos en su base local. Adicionalmente la institución B puede utilizar XSLT para transformar el documento XML en una página web o mostrar a un administrador.

      Por todo esto XML juega un papel fundamental en la web de datos abiertos y la integración de sistemas.

      Sin embargo, XML presenta carencias cuando lo que queremos modelar son relaciones conceptuales y no sólo la estructura de documentos.

      Entonces podemos decir que XML es necesario pero no suficiente! Y es allí donde aparecen construcciones más ricas semánticamente como los Grafos de Conocimiento (Knowledge Graphs), y en especial RDF.


      “In short, XML allows users to add arbitrary structure to their documents but says

      nothing about what the structures mean”

      De: XML and the Second-Generation Web. Jon Bosak, Tim Bray. Scientific American, Mayo 1999.


    • 2. Grafos de Conocimiento (Knowledge Graphs)

      Como ya analizamos antes (para ver esta conclusión tienes que haber completado la ACTIVIDAD INDIVIDUAL 1: ¿Qué nos dice un documento XML?) una de las ventajas de XML es la de validar la estructura de documentos, donde la estructura lógica de documentos XML es la de ARBOL, mientras que la estructura de la Web es de GRAFO. Por consiguiente, para modelar la Web deberíamos utilizar un modelo que represente GRAFOS.

      Veamos ahora un ejemplo de grafo de conocimiento: el Grafo de Google


    • Contenido de la Unidad4-Parte I en formato imprimible.
    • MATERIAL COMPLEMENTARIO PARTE I

    • REFERENCIAS

      [1] M. Nickel, K. Murphy, V. Tresp, and E. Gabrilovich.(2016). A review of relational machine learning for knowledge graphs. Proc. of the IEEE. (Encuentran el artículo en el archivo definition-KG.pdf en el EVA del curso)

      [2] Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 3,160018 . https://doi.org/10.1038/sdata.2016.18 (Encuentran el artículo en el archivo FAIR.pdf en el EVA del curso)

      [3] Ogden, C. K., Richards, I. A., Malinowski, B., Crookshank, F. G., & Postgate, J. P. (1923).The meaning of meaning: A study of the influence of language upon thought and of the science of symbolism. London: K. Paul, Trench, Trubner & Co.

      [4] Noy, N., Gao, Y., Jain, A., Narayanan, A., Patterson,A.&Taylor, J. (2019). Industry-scale Knowledge Graphs: Lessons and Challenges: Five diverse technology companies. acmqueue, Volume 17, issue 2. (Encuentran el artículo en el archivo acmqueue.pdf en el EVA del curso)

      [5] Holger Knublauch and Dimitris Kontokostas. 2017. Shapes Constraint Language (SHACL), W3C Recommendation 20 July 2017. W3C Recommendation. World Wide Web Consortium. https://www.w3.org/TR/2017/REC-shacl-20170720/

      [6] Šejla Čebirić, François Goasdoué, Haridimos Kondylakis, Dimitris Kotzinos, Ioana Manolescu, Georgia Troullinou, and Mussab Zneika. 2019. Summarizing semantic graphs: a survey. The Very Large Data Base Journal 28, 3 (2019), 295–327.


    • Video de presentación de Google cuando lanzaron el Panel de Conocimiento explicando el uso del "Grafo de Conocimiento" en el 2012.

      Actualmente el grafo representa recursos mucho más interactivos que al comienzo. Si se busca por ejemplo un negocio se puede obtener la franja horaria con indicaciones de las horas más ocupadas.

      Es interesante buscar distintos recursos en la web, como grupos musicales, artistas, alojamientos y comparar con lo que anuncia el video de hace 8 años. Observen por ejemplo que también se muestran en el panel actual las redes sociales donde un artista tiene presencia y recomendaciones relacionadadas.

    • MATERIAL OBLIGATORIO PARTE II

    • Parte II. RDF: un tipo de Grafo de Conocimientos


      Objetivo:

      Estudiar la forma en que RDF identifica los recursos y el vocabulario que utiliza y cómo RDF es uno de los pilares fundamentales para la construcción de Datos Enlazados (Linked Data).

      Contenido de la Unidad 4 – Parte II

      1. ¿Cómo nombrar los datos en la Web? 

      2.  RDF: conceptos, sintaxis y semántica

                2.1 Definición del modelo abstracto de RDF

                2.2 RDF serializaciones

                2.3 Representando hechos simples con RDF

                2.4 RDF Schema/RDF vocabulario

                2.5 Inferencia en RDF

                2.6 Semántica de RDF


      MATERIAL: 

      **** Capítulos 3, 5 y 6  del libro: 
      Allemang, Dean, and James Hendler. Semantic web for the working ontologist: effective modeling in RDFS and OWL. Elsevier, 2011. Accesible en  http://www.kevenlw.name/downloads/Ontologist.pdf

      ** Capitulo 2 del libro:
      Foundations of Semantic Web Technologies.
      Pascal Hitzler, Markus Krötzsch, Sebastian Rudolph
      Textbooks in Computing, Chapman and Hall/CRC Press, 2009.
      (accesible en:
       SWTechnologies.pdf)



    • 2. RDF: conceptos, sintaxis y semántica

    • --------------------------------------------Fin de la Unidad 4----------------------------------------------