Date post: | 29-Jul-2015 |
Category: |
Documents |
Upload: | mhallo1700 |
View: | 22 times |
Download: | 1 times |
Versionado de documentos legislativos usando XML
Maria Hallo
Escuela Politécnica Nacional Quito-Ecuador
Dr Pablo de la Fuente
Dra Mercedes Martínez
Universidad de Valladolid-España
Problemática
• Documentos legislativos en diferentes fuentes, formatos , lenguajes, estructuras internas
• Modificaciones en el tiempo
• Necesidad de consolidación automática
• En cada jurisdicción diferentes formas de asignar identidades para versionado
Modelos de datos basados en XML
• Permite más sofisticadas búsquedas, Manejo de versiones de documentos y sus partes
• Formato no propietario
• Preservación a largo plazo
• Apropiado para difusión en la Web semántica
Experiencias
En redacción de texto legislativo:
• Tasmania, Canadá, USA, Sud Australia, Italia, España
En administrar documentos legislativos digitales :
• UK, Singapur, Tasmania, Canadá USA y un número de estados de USA
Formatos XML para documentos legales
Experiencias en Europa• NormeInRete (Italia)• Cen Metalex• SDU BWB (Holanda)• LexDania (Dinamarca)• eLaw (Austria)• CHLexML (Suiza)
• General formats for legal sources,2007
Formatos XML para documentos legales
Otras experiencias
• Akoma Ntoso (Africa)
• En Act (Tasmania)
• Legal RDF en USA
• Dynamic Relationship Modelling (Spain)
• Cronelex System (Spain)
Estándares XML legales Primera generación, describen texto y
estructura considerando entidades
Segunda generación ponen atención a la estructura del texto,descripción y metadatos sin un análisis previo de clases originando un gran número de DTDs y esquemas (Norme in Rete..)
Tercera generación basada en patrones describiendo clases, propiedades , modelos de contenidos y ontologias. Akoma Notoso, Cen Metalex
Estándares XML legales
Cuarta generación de estándares:
Usan patrones y validaciones basadas en reglas. Ej uso de:
Schematron : Lenguaje de esquema estructural expresado en XML,
RELAX NG: Regular languaje for XML next generation
Capas para representar el modelado de doc legales
• Texto
• Estructura
• Metadatos
• Ontologías
• Reglas legales
Norme in Rete(Legislation on the Net)
Proyecto iniciado en 1999, financiado por el Ministerio de Justicia Italiano.
Productos:
Máquina de búsqueda para recuperar leyes publicadas en diferentes sitios Web de la administración pública
implementado en Sistema Norma. (migrado a normattiva.it)
Estándares NIR (basados en XML, RDF): • DTD para describir la estructura formal y funcional• URN para documentos legales independiente de
URL
Norme in Rete DTDS
• DTD estricto: usado para marcar doc legales (180 elementos)
• Loose DTD: tiene pocas reglas obligatorias
• DTD base: subconjunto del DTD estricto, mínimo para garantizar la interoperabilidad (100 elementos)
Norme in Rete
1.global.dtd:contiene definiciones globales
2. norme.dtd: contiene definiciones de la estructura de división
3. text.dtd: para definiciones de estructuras de texto, tablas and formas;
4. meta.dtd: contiene definiciones de esquemas de metadatos.
Ej NIR
Urn:nir:<authority> :<measure> :<details> :<annex>* @<version>? #<partition>?
urn:nir:stato:decreto.legislativo:1992-07-24;358#art5
@fecha de la última modifición
0 o más veces
? 0 o una vez
Elementos del DTD
• Estructurales: título, preámbulo, sección, artículo, párrafo.
• Especiales: referencias a otras leyes• Metadatos. Fecha de publicación, relaciones,
clasificación• Elementos semánticos:
Provisiones: Obligaciones, Prohibiciones, Modificaciones
Roles
Norme.DTD
Estructura formal del texto normativo• Título(tipoDoc|dataDoc|numDoc|títuloDoc|
dataDoc..)• Fórmula inicial, Preámbulo• Articulado(Libro|parte|título|capítulo|secc|
párrafo|artículo)• Fórmula final• Conclusiones• Anexos
Metadatos• Dublincore (dc:title | dc:creator | dc:subject |
dc:description | dc:publisher|dc:contributor |dc:date | dc:type | dc:format |dc:identifier | dc:source | dc:language |dc:relation | dc:coverage | dc:rights)
• Disposiciones: Modificaciones….• Trabajos preparatorios• Editoriales • Comentarios
Disposiciones
• Describen el significado de cada fragmento de texto, su tiempo de validez, derogación, etc.
Sistema Norma
• Cubre todas las fases del ciclo de vida de un documento legal
• Los documentos siguen el DTD de Norme In Rete
Modelo de datos Sistema Norma
Modelo E-R Sistema Norma(metadata)
Almacenamiento de metadatos
Los metadatos que describen la cadena de versionamiento de cada documento y para cada versión su intervalo de tiempo, referencias normativas y anexos se almacenan en un sistema relacional
Consolidación
Se realiza con tres paquetes
• Documentos y anexos modificantes
• Documentos y anexos a modificarse
• Lista de provisiones modificatorias
• Cada paso del proceso de modificación es anotado en el texto modificado: Tipo de modificación, nombre del documento modificante, partición de texto modificado
Consolidación
• Se convierten los paquetes XML a formato Word
Problemas
• Estructura estricta del texto
• Documentos almacenados en sistema de archivos
• Sistema ligado a la estructura
• Consultables versiones de documentos
• Consolidaciones semiautomáticas
Akoma Ntoso (Africa) Architectrure for Knowledge-Oriented Management of Any
normative Texts using Open Standards and Ontologies
Conjunto de estándares y metodologías para e-servicios parlamentarios en el contexto Pan-Africano:
• Akoma-Ntoso XML schema,
• Convenciones de nombres para identificación de recursos legales(URI2)
• Guias para preparación de documentos legislativos bien estructurados
Usos de Akoma Notoso
Formatos usados en
• Legislación primaria
• Debates parlamentarios
• Listas de modificaciones
• Documentos judiciales
Patrones
• Container: estructuras secuenciales no jerárquicas. Ej prefacio, preámbulo, conclusiones, cuerpo
• Hcontainer: Contenedores jerárquicos de estructuras. Ej capítulo, sección, artículo, cláusula
• Blocks: Contenedores de texto. Ej Párrafos
Patrones
• Inline : Contenedores de texto. Ref, título, fecha
• Marker: Ej imágenes, notas
• Popup: Ej notas de autoría, firmas pies de documentos
• www.akomanotoso.org
Formato de Intercambio abierto para
recursos legales y legislativos
CWA 15710:2010
CEN METALEX
Rediseñado considerando lecciones de Norme in Rete y Akoma Notoso
CEN METALEX
MetalexCaracterísticas
• Independiente de lenguaje y jurisdicción• No interfiere con formatos propietarios• Estructura basada en contenedores que a su
vez contienen otros bloques o contenedores• Basado en XML, RDF, RDF(S), OWL, Xlink,
XHTML. XSL• Soporta URIs a un nivel muy detallado• Combinable con GML para encadenar
regulaciones a áreas espaciales
Entidades Bibliográficas en Metalex
Conceptos
Fuente de ley bibliográfica: objeto, bibliográfico que fue es o puede ser referenciado
MetalexPrincipios de diseño
• Cada elemento Metalex es definido por un nombre, modelo de contenido y uno o más atributos
• La Estructura de un doc legislativo es definida por artículos agrupados en particiones y a su vez compuestos de partes y subpartes
• Se puede tener varias versiones en varios lenguajes el mismo documento (atrib lang)
MetalexPrincipios de diseño
• Cada elemento puede tener zero o más anotaciones
• Se exige identificación con URIs pero no se restringe a un formato
• Los metadatos se pueden almacenar dentro de los documentos y además separados como triples RDF
MetalexPrincipios de diseño
• Containers: book, chapter, section
• Blocks: sentences, titles, indices, etc.
• MetaLex: (containers +) articles (+ subcontainers) + text
MetalexManejo del tiempo
Permite almacenar:• Fechas de publicación, promulgación,
derogación• Períodos de validez, de eficacia.(El período de
tiempo en el cual deben haber ocurrido los hechos para que la legislación sea aplicable)
• Es posible tener varias versiones de un texto en el mismo documento
MetalexMetadatos
Ontologías de metadatos contienen:
Entidades Bibliográficas: Trabajo, expresión, manifestación, item y modelo de contenidos
Referencias entre entidades bibliográficas
Actividades: Acciones y roles de entidades bibliográficas (creación, derogación, promulgación)
Agentes y competencias usados en actividades legislativas
MetalexTransformaciones a RDF
Los Metadatos pueden ser envueltos en manifestaciones XML y representados como atributos pueden ser transformados a RDF con hojas de estilo XSL.
MetalexAdministración de versiones
El esquema de metadatos Metalex OWL incluye definiciones de tipos de evento a nivel de expresión
Creación de una entidad bibliográfica, entrada en vigor de una expresión (versión), derogación de una expresión
Expresiones modificantes
• A nivel de container inserción/borrado de una parte
• A nivel de bloque inserción/borrado /modificación de texto
Metalex Document Server
Metalex Document Server doc.metalex.eu
Almacena las versiones de estatutos y regulaciones del sitio holandés http://wetten.overheid.nl publicado desde mayo del 2011 como CEN Metalex y como Linked Data
Wetten.overheid.nl
Es la fuente de datos para información legislativa en Holanda. Permite búsquedas por un artículo específico asi como por la versión de un texto a una fecha específica. Proporciona una API para recuperar manifestaciones XML de estatutos y regulaciones
Wetten.overheid.nl
• Problemas : identificadores no consistentes (varios apuntan al mismo elemento)
• Se recupera solamente la última versión
• Fecha reportada como fecha de modificación es la fecha del registro en e l CMS
• Metadatos en tablas HTML
Conversión
• Modela cada documento segun FRBR
• Crea URIs para todas las partes del texto legislativo (modelo UK)
• Genera metadatos RDF de cada documento y sus elementos asi como de los eventos y procesos que los modifican
Estructura de un doc en Metalex
Metadatos
El MDS usa para metadatos:• La Ontología Metalex para representar
eventos de modificaciones• El Modelo de Eventos (Simple Event
Model)• OPMV (Open Provenance Model
Vocabulary) para una descripción de procesos e información de orígenes de datos.
Modificaciones
• Cada elemento es identificado con una URI opaca con un valor Hash SHA1 del contenido textual de un elemento XML y simultáneamente mantienen un link entre el URI opaco y el identificador permitiendo distinguir diferentes expresiones en el tiempo.
• (Metalex Doc Server)
Legislation.gov.uk
• El sitio contiene legislación como fué originalmente promulgada y versiones presentando cambios a la legislación en el tiempo
Modificaciones
Modelo de datos• Estructura en árbol implementada con XML para los
documentos y metadatos y un grafo representado en RDF para los metadatos
• Se usa una base de datos XML para los documentos y metadatos y un repositorio RDF para los metadatos
Estructura de un acto legislativo (última versión)
Adapted from: http:www.legislation.gov.uk/ukpga/1985/65/data.xml
Metadata
Dublin Core metadata
Links Unapplied effects
Legislation
Preliminary Body
Pblock(Section)
Pgroup(Paragraphs)
Part
Appendix Schedule Changes Explanatory Notes
PBlock amendement
XML doc
Others
La estructura de un item legislative está definida en legislative.xsd
Entidades (FRBR)(Requisitos Funcionales de Registros Bibliográficos)
Item legislativo (Work)
( Acto, Parte, Sección, Schedule (Párrafo))
Versión ( Expression)
(previa, actual, prospectiva, a una fecha dada)
Publicación ( Manifestation)
(pdf, rdf, xml, htm)
copias (items)
• Recursivo
Modificaciones
Los elementos usados para marcar cambios en textos se describen en Changes.xsd
•Tipos de cambios: Adición, sustitución, referencias a comentarios, acrónimos, abreviaciones, citaciones
Modificaciones
Modificacioneshttp://www.legislation.gov.uk/changes/applied/affected/ukpga?affected-title= transport act 1985
Proceso editorialhttp://www.legislation.gov.uk/pdfs/GuideToRevisedLegislation_Jan_2012.pdf
• Una nueva pieza de legislación se graba como una versión promulgada (enacted)
• Se prepara una versión revisada tabulando efectos en otras legislación es y añadiendo anotaciones a la versión revisada (Ej. Fechas de entrada en vigor, alcance geográfico, etc) (toma de 4 a 8 semanas)
• Los efectos tabulados se presentan en el website en la sección cambios a la legislación
Legislación revisada vs promulgadahttp://www.legislation.gov.uk/pdfs/GuideToRevisedLegislation_Jan_20
12.pdf
Tipos de anotaciones
Hay varios tipos de anotaciones:
•Modificaciones textuales (F-notes)
•Información adicional (E-Notes)
•Modificaciones que no alteran el texto (C-notes)
•Información de inicio de los cambios (I-notes)
•Citas marginales (M-notes)
•Información editorial (X notes)
Annotations
Ej de anotación en el Acto analizado1985 que no alteran el texto (tipo C).
• C1 Act amended by S.I. 1986/1628, reg. 5(2)(3)• Los cambios realizados aparecen en el
contenido y son referenciados con anotaciones
Annotaciones
Ej: S.14A(7) applied (with modifications) (30.12.2005) Adoption and Children Act 2002 by Ca.29(6) (with Sch 4 paras 6-8); S.I.2005/2213, art. 2(c).
• Provisión afectada- subsección (7) de la sección 14A• El tipo de efecto: applied (with modifications)• La fecha en la que la provisión afectante entra en vigor
(30.12.2005)• La legislación afectante Adoption and Children Act 2002• La provisión afectante : subsec 6, sección 29• La provisión que origina la entrada en vigor
S.I.2005/2213, art. 2(c).
URIs
• URIs de documentos : Se usan para referirse a documentos particulares en la web: versiones de items. Siguen el siguiente template:
http://www.legislation.gov.uk/{type}/{year}/{number}[/{section}][/{authority}][/{extent}][/{version
}]
http://www.legislation.gov.uk/ukpga/1985/67/2003-04-01
URIshttp://www.legislation.gov.uk/developer/uris
• URIs de identificación
http://www.legislation.gov.uk/id/{type}/{year}/{number}[/{section}]
URIs
• URIs de representaciones
Cada documento es disponible en múltiples formatos. La Uri para un formato en particular sigue el template:
http://www.legislation.gov.uk/{type}/{year}/{number}[/{section}][/{authority}][/{extent}][/{version}]/data.ext
Documento Legislativo (version original promulgada)
Transport Act 1985 1985 Chapter 67
• Content table:• Introductory Text• Part I General Provisions Relating to Road Passenger
Transport• Abolition of road service licensing• 1. Abolition of road service licensing.• Meaning of “local service”• 2. Local services.• Traffic commissioners• 3. Traffic commissioners.• 4. Inquiries held by traffic commissioners.• 5. Assistance for traffic commissioners in considering
financial questions.• ……………
Ej cambio• Modificación prospectiva de texto: section-26-6
http://www.legislation.gov.uk/id/ukpga/1985/67/section/26/6
s. 26(6) text amended by 2008 c. 26 s. 62(9)
s. 26(6)(a) text amended by 2008 c. 26 s. 62(9)(b)
6.A condition attached to a licence under subsection (5) above shall—
(a)apply only to vehicles which have their operating centre in the traffic area for which the commissioner acts; and
(b)be in addition to (and not be taken as prejudicing in any way) any conditions attached to the licence under section 16 of the 1981 Act as to the maximum number of vehicles which the operator may at any one time use under the licence.
• Según sección-62-9 de http://www.legislation.gov.uk/id/ukpga/2008/26/section/62/9
(9)In subsection (6)—(a)for “subsection (5)” substitute “ subsection (5A) ”;(b)in paragraph (a) after “the commissioner” insert “ who attached that condition ”.
http://legislation.data.gov.uk/ukpga/1985/67/data.xmlúltima versión
Metadata (dc elements)
• <Legislation xmlns=http://www.legislation.gov.uk/namespaces/legislation DocumentURI="http://www.legislation.gov.uk/ukpga/1985/67" IdURI="http://www.legislation.gov.uk/id/ukpga/1985/67" NumberOfProvisions="305“ xml:base="http://www.legislation.gov.uk/id/ukpga/1985/67">
• - <ukm:Metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dct="http://purl.org/dc/terms/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:ukm="http://www.legislation.gov.uk/namespaces/metadata><dc:ident>http://www.legislation.gov.uk/ukpga/1985/67</dc:iden>
• <dc:title>Transport Act 1985</dc:title> • <dc:description>An Act to amend the law relating to road
passenger transport; to make provision for the transfer of the operations of t he National Bus Company……….</dc:description>
• <dc:date>1985-10-30</dc:date> • ………… • <dc:modified>2011-05-27</dc:modified> • <dct:valid>2009-09-01</dct:valid>
http://legislation.data.gov.uk/ukpga/1985/67/data.xmlMetadata (atom link elements)
– atom:link rel="self" type="application/xml" href="http://legislation.data.gov.uk/ukpga/1985/67/data.xml" />
– <atom:link rel="http://www.legislation.gov.uk/def/navigation/resources" href="http://www.legislation.gov.uk/ukpga/1985/67/resources" title="More Resources" />
– <atom:link rel="http://www.legislation.gov.uk/def/navigation/act" href="http://www.legislation.gov.uk/ukpga/1985/67" title="whole act" />
– <atom:link rel="http://www.legislation.gov.uk/def/navigation/introduction" href="http://www.legislation.gov.uk/ukpga/1985/67/introduction" title="introduction" />
– <atom:link rel="http://www.legislation.gov.uk/def/navigation/body" href="http://www.legislation.gov.uk/ukpga/1985/67/body" title="body" />
– <atom:link rel="http://www.legislation.gov.uk/def/navigation/schedules" href="http://www.legislation.gov.uk/ukpga/1985/67/schedules" title="schedules" />
– <atom:link rel="alternate" type="application/rdf+xml" href="http://legislation.data.gov.uk/ukpga/1985/67/data.rdf" title="RDF/XML" />
– <atom:link rel="alternate" type="application/xhtml+xml" href="http://legislation.data.gov.uk/ukpga/1985/67/data.htm" title="HTML snippet" />
– ………………..
http://legislation.data.gov.uk/ukpga/1985/67/data.xmlPrimaryMetadata
• <ukm:PrimaryMetadata>• - <ukm:DocumentClassification>• <ukm:DocumentCategory Value="primary" /> • <ukm:DocumentMainType
Value="UnitedKingdomPublicGeneralAct" /> • <ukm:DocumentStatus Value="revised" /> • </ukm:DocumentClassification>• <ukm:Year Value="1985" /> • <ukm:Number Value="67" /> • <ukm:EnactmentDate Date="1985-10-30" />
http://legislation.data.gov.uk/ukpga/1985/67/data.xmlUnapplied effects: Text amended
<ukm:UnappliedEffect Row="4160" Type="text amended" Index="57" Modified="2012-05-25T15:44:39.594+01:00" AffectedClass="UnitedKingdomPublicGeneralAct“ AffectedYear="1985" AffectedNumber="67" AffectedProvisions="s. 26(6)" AffectingClass="UnitedKingdomPublicGeneralAct" AffectingYear="2008" AffectingNumber="26" AffectingProvisions="s. 62(9)" AffectedURI=http://www.legislation.gov.uk/id/ukpga/1985/67 AffectingURI=http://www.legislation.gov.uk/id/ukpga/2008/26 AffectingCommencementSections="http://www.legislation.gov.uk/id/ukpga/2008/26/section/134http://www.legislation.gov.uk/id/ukpga/2008/26/section/134"
http://legislation.data.gov.uk/ukpga/1985/67/data.xmlUnapplied effects: Text amended
<ukm:AffectedProvisions> <ukm:Section Ref="section-26-6“
URI=http://www.legislation.gov.uk/id/ukpga/1985/67/section/26/6 StartDate="1991-01“
</ukm:AffectedProvisions>- <ukm:AffectingProvisions> <ukm:Section Ref="section-62-9"
URI=http://www.legislation.gov.uk/id/ukpga/2008/26/section/62/9 StartDate="Prospective“ ukm:Section>
</ukm:AffectingProvisions> <ukm:AffectedTitle>Transport Act1985</ukm:AffectedTitle>
<ukm:AffectingTitle>Local Transport Act 2008</ukm:AffectingTitle>
</ukm:UnappliedEffect>
Efectos no aplicados
• La ontologia Metalex se usa para describir los efectos que se usan listando esa lógica
• Un Trabajo (Work) es realizado por alguna versión (Expression)
• Esa version es el estado inicial de alguna Modificación legislativa
• La modificación legislativa tiene legislaciones afectantes de otra legislación
(RDF/XML)
Problemas
Cada versión de un item legislativo es grabada en un archivo lo cual implica redundancia de datos y posibilidades de inconsistencia en el caso de corrección de errores
Los tiempos requeridos para anotaciones son muy largos de 4 a 8 semanas por texto legislativo
Existe dificultad en obtener los datos necesarios para construir las versiones revisadas de textos histórico
Conclusiones
Es necesario estudiar alternativas de manejo de versiones de textos legislativos
• Usando RDF y ontologías estándar• Buscando optimizar el almacenamiento,
tiempos de búsqueda y recuperación de versiones de textos y fragmentos legislativos consolidados.
• Usando sistemas de administración de bases de datos XML
Conclusiones
Es necesario estudiar alternativas de manejo de versiones de textos legislativos
• Usando modelos de grafos y ontologías estándar
• Buscando optimizar el almacenamiento, tiempos de búsqueda y recuperación de versiones de textos y fragmentos legislativos.
• Usando sistemas de administración de bases de datos XML y repositorios RDF
Bibliografia
• Palmirani M and Brighi R. Norma-System: A Legal Document System for Managing Consolidated Acts. DEXA 2002. Database and Expert Systems Applications, Springer, 2002; 310-320
• Sheridan J. Legislation.gov.uk, in VoxPopuLII. 2010, Cornell University Law School. http://blog.law.cornell.edu/voxpop/tag/legal-linked-data/(2011, accessed march 2012).
• Hoekstra R. The MetaLex Document Server, in VoxPopulLII. http://blog.law.cornell.edu/voxpop/2011/10/25/the-metalex-document-server/ (2011, accessed Nov 2011)
• Martínez-González M, Derniame J and De la Fuente P. A method for the dynamic generation of virtual versions of evolving documents. In: 17th ACM Simposium on Applied Computing (SAC 2002), Special Track on Database and Digital Library Technologies. Madrid , Spain, March 2002.
Bibliografia
• Palmirani, M. et al. Deliverable 3.1. General XML format(s) for legal Sources, University of Amsterdam, University of Bologna, http://www.estrellaproject.org/doc/D3.1-General-XML-formats-For-Legal-Sources.pdf (2006, accessed Nov 2011)
• Francesconi E. The “Norme in Rete”- project: Standards and Tools for Italian Legislation. International Journal of Legal Information, 2006; 34: 358-376.
Agradecimientos
Al grupo GRINBD del Departamento de Informática de la Universidad de Valladolid