ISSN: 2255-3703
133
Skopos 3 (2013),
133
-
1
50
CNAPSI
Corpus de inscripciones nabateas, norarábigas,
palmirenas y siriacas antiguas. Un proyecto en red
Juan P. Monferrer Sala / Fuensanta Guerrero Carmona / Manuel Marcos Aldón
Universidad de Córdoba
ff1mosaj@uco.es, cc1gucaf@uco.es, lr1maalm@uco.es
Fecha de recepción: 15.06.2012
Fecha de aceptación: 01.09.2012
Resumen: Presentación lingüística, morfológica y descriptiva de un corpus de
inscripciones en dialectos arameos y norarábigo para su difusión en red con sus
representaciones correspondientes.
Palabras clave: Traducción, Nabateo, Norarábigo, Palmireno, Siríaco, Difusión en
red, MySQL, Recuperación de información
CNAPSI
Corpus of Nabatean, North Arabian, Palmyrene and (Old) Syriac
Inscriptions. An on-line project
Abstract: Our aim in the present article is to give a linguistic, morphologic and
descriptive presentation of a corpus of inscriptions in Aramaic and North-Arabian
dialects for their dissemination in Internet, together with their respective iconographic
representations.
Keywords: Translation, Nabataean, North Arabian, Palmyrene, Old Syriac, on-line
diffusion, MySQL, Infomation Retrieval
Sumario: 1. El marco lingüístico. 2. Desarrollo cnico del proyecto CNAPSI. 2.1. CNAPSI
(Modelo de base de datos. 2.2. Normalización. 2.3. Metodología para el diseño de bases de
datos de CNAPSI. 2.4. Edición de aplicación. 2.5. Planificación del proyecto. 3. Modelización
de datos y herramientas auxiliares. 3.1. Posicionamiento y difusión. 3.2. Control de
formación.
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
134
Skopos 3 (2013),
133
-
1
50
1. El marco lingüístico.
Los cuatro registros lingüísticos que concurren en el presente
Proyecto de difusión se corresponden respectivamente con cuatro corpora
textuales correspondientes todos ellos a materiales inscripcionales. Estos
cuatro registros, todos ellos registros medios, corresponden a tres dialectos
arameos (nabateo, palmireno y siriaco antiguo) y a uno árabe (norarábigo
antiguo).
Aun cuando la lengua de los nabateos era la lengua de un grupo
étnico árabe, sin embargo utilizaron el arameo en los ámbitos literario e
inscripcional
1
. El dialecto árabe utilizado por los nabateos suplió al arameo,
que fue progresivamente arabizado en el siglo
IV
AD.
2
Este proceso gradual
es perceptible, por ejemplo, en los préstamos árabes que figuran en los
textos arameos, que son, esencialmente, términos técnicos seleccionados
por el epigrafista o por quien diseñara el texto que acabó siendo labrado
3
.
Las afinidades lingüísticas que se aprecian entre lo que podríamos
calificar como ‘dialecto arameo-árabe nabateo’ y el dialecto utilizado por los
grupos árabes mesopotámicos durante el periodo neoasirio parecen
representar la médula dialectal de la que surgió la lengua de los nabateos
4
.
Este ‘dialecto protoárabe’ que utilizaron los nabateos debe ser claramente
distinguido del que usaban sus vecinos árabes de Qēdār y Hagar, por lo que
la Nabataea debió ser un área lingüística y culturalmente separada de la
sociedad norarábiga del momento
5
.
Los materiales inscripcionales nabateos, de variada tipología textual
6
,
son de enorme importancia. Tenemos documentadas, en la actualidad, más
de un millar de inscripciones de tipo funerario y votivo, las más importantes
procedentes de las ciudades de Petra, Basora y al-iǧr, en las cercanías de
Madā’in Ṣāli, en la Península Arábiga. También contamos con más de tres
mil inscripciones breves fragmentarias procedentes del sur de la Península
del Sinaí, así como contratos privados y un fragmento hallado en una de las
1
Jean Starcky, “The Nabataeans: a historical sketch”, Biblical Archaeologist 18 (1955), cols.
924-926.
2
A. F. L. Beeston, “The Inscription Jaussen-Savignac 71”, Proceedings of the Seminar for
Arabian Studies 3 (1973), pp. 69-72.
3
M. O’Connor, “The Arabic Loanwords in Nabatean Aramaic”, Journal of Near Eastern Studies
45 (1986), pp. 213-229.
4
David F. Graf, “The Origin of the Nabateans”, Aram 2 (1990), pp. 59-68.
5
Federico Corriente, “The Phonemic System of Semitic from the Advantage Point of Arabic and
its Dialectology”, Aula Orientalis 23 (2005), p. 171 y la bibliografía allí señalada.
6
Cf. Francisco del Río Sánchez, Textos epigráficos en arameo palmireno, hatreo y nabateo,
«Estudios de Filología Semítica» 6, Barcelona: Universitat de Barcelona, 2006, pp. 97-113.
Monferrer
Sala / Guerrero Carmona/ Marcos Aldón
135
Skopos 3 (2013),
133
-
1
50
cuevas del Mar Muerto
7
. Pero a la vuelta del siglo
IV
AD se advierte la
coexistencia de textos árabes y nabateos, además de la mezcla de escritura
nabatea y lengua árabe: son los casos, por ejemplo, de la inscripción greco-
nabatea –procedente de ʼUmm al-Ǧimāl– de la tumba de Fihr bar Šullay,
preceptor del filarca Ǧadīmah, de la tribu de los Banū Tanūḫ
8
, así como la
célebre inscripción de al-Namārah, escrita con caracteres nabateos, pero a
excepción de una palabra (bar) en lengua árabe, que sigue suscitando
diversos posicionamientos en torno a su correcta lectura
9
En el caso del dialecto arameo utilizado en Palmira éste representa
una variante de la lengua literaria que tiene sus orígenes en el período más
antiguo, que desde la época del arameo imperial se erige en como lengua
de comunicación en todo el ámbito medio-oriental. Los rasgos específicos
del dialecto arameo palmireno aparecen sobre todo en el campo léxico, v.gr.
presencia de abundantes préstamos del griego, también del latín,
significado particular que adoptan algunos términos con respecto a otros
dialectos arameos, así como el sentido incierto que presentan algunos
sustantivos relacionados con el comercio, la construcción y una serie de
títulos militares. El arameo de Palmira se escribía con una caligrafía que
recuerda a la cuadrática hebrea en sus modalidades monumental y simple.
Los caracteres aparecen normalmente aislados, con diferencia entre los
grafemas inicial/medial y final únicamente en un caso (/n/) y la
direccionalidad de la escritura seguía el curso derecha–izquierda.
En cuanto a los textos siriacos, el registro lingüístico empleado en
este material inscripcional, calificado como ‘siríaco antiguo’, se inscribe
dentro de la diversidad dialectal de la lengua más hablada en el medio
oriental del momento, el arameo, siendo, en esencia, una variante del
arameo clásico, pero sin haber desarrollado las características propias del
siríaco literario posterior
10
, que generará un vasta y rica literatura entre los
siglos
III
y
XIII
AD. Este registro se encuentra, por lo tanto, en un estadio
intermedio entre el arameo clásico y el siríaco literario tardío. Sin embargo,
7
F. Rosenthal (ed.), An Aramaic Handbook. 4 vols., Wiesbaden: Otto Harrassowitz, 1967.
8
Enno Littmann, Semitic Inscriptions, Leyden: E. J. Brill, 1949, IV/A, pp. 37-40, nº 41.
9
Cf. por ejemplo Jean Cantineau, Le nabatéen. 2 vols., Osnabrück: Otto Zeller,
2
1978 (= Paris,
1930-32), II, pp. 49-50; W. Caskel, “Die Inschrift von en-Nemāra- Neu gesehen”, Mélanges de
l’Université St. Joseph 45 (1969), pp. 367-379; Irfan Shahîd, “Philological Observations on the
Namāra Inscription”, Journal of Semitic Studies 24 (1979), pp. 33-42; J. Bellamy, “A New
Reading of the Namārah Inscription”, Journal of the American Oriental Society 105/1 (1985), pp.
31-74.
10
Han J. W. Drijvers, Old Syriac (Edessan) Inscriptions, Leiden: E. J. Brill, 1972; H. J. W.
Drijvers John F. Healey, The Old Syriac Inscriptions of Edessa and Osrhoene. Texts,
Translations, and Commentary, Leiden: E. J. Brill, 1998.
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
136
Skopos 3 (2013),
133
-
1
50
hay que precisar que siendo el arameo la lengua más hablada, no era la
más escrita, pues el griego representaba la lengua de prestigio.
Finalmente, el término ‘norarábigo’ describe a un grupo de dialectos
que se presentan, a primera vista, como lingüísticamente homogéneos
desde su fase arcaica.
11
El repertorio fonético, morfológico y sintagmático
halla mayor afinidad con ese grupo dialectal que con cualquier otro externo
a este grupo. El ‘norarábigo clásico’, el que conocemos tradicionalmente
como ‘árabe clásico’ o simplemente como ‘árabe’, está documentado en un
reducido número de inscripciones del siglo
IV
AD, así como por medio de
ejemplos de dialectalismos recogidos en fuentes árabes ulteriores
compuestas por autores musulmanes.
12
La más antigua de estas
inscripciones es una hallada en el awrān, la célebre inscripción de al-
Namārah, datada el año 328 AD, en la que el lapicida se sirvió del alfabeto
nabateo para la labra del texto.
Los datos norarábigos que se hallan contenidos en materiales
inscripcionales surarábigos están constituidos, esencialmente, por
antropónimos y topónimos, así como por otros elementos de tipo
gramatical.
13
Contamos, además, con inscripciones qaḥṭāníes,
14
en las que
también se encuentran elementos norarábigos, al igual que sucede con las
inscripciones halladas en Naǧrān y, sobre todo, en el denominado Himno
de Qāniya’ en honor de la diosa Šams, de finales del siglo
I
AD
15
2.-Desarrollo técnico del proyecto CNAPSI.
2.1.CNAPSI (Modelo de Base de Datos).
La base de datos del CNAPSI consiste en un conjunto de información
organizada, de manera que posteriormente se pueda utilizar de forma
sencilla y simple. Esta información está relacionada, y está agrupada o
estructurada.
Cada base de datos incorporada en el modelo CNAPSI se compone de
una o más tablas que guardan un conjunto de datos. Cada tabla consta de
11
M.C.A. Macdonald, “Ancient North Arabian”, en Roger D. Woodard (ed.), The Ancient
Languages of Syria-Palestine and Arabia, Cambridge: Cambridge University Press, p. 181; para
una completa descripción del ‘norarábigo antiguo’: pp. 179-224.
12
Chaim Rabin, Ancient West-Arabian, London: Taylor’s Foreign Press, 1951, passim.
13
Walter W. Müller, “Das Altarabische und das Klassische Arabisch”, en Wolfdietrich Fischer
Helmut Gätje (eds.), Grundriss der arabischen Philologie. I. Sprachwissenschaft, Wiesbaden:
Ludwig Reichert, 1982, pp. 26-28.
14
Se trata del material inscripcional procedente de la célebre ciudad surarábiga de Qaḥṭān,
Christian Robin, L’arabie antique de Karib’īl à Mahomet: nouvelles donnnées sur l’histoire des
Arabes grâce aux inscriptions, Aix-en-Provence: Edisud, 1991-93, pp. 120-121.
15
C. Robin, L’arabe antique, pp. 122-125.
Monferrer
Sala / Guerrero Carmona/ Marcos Aldón
137
Skopos 3 (2013),
133
-
1
50
una o más columnas y filas. Las columnas guardan una parte de la
información sobre cada elemento que está guardado en la tabla, y cada fila
conforma un registro.
Entre las principales características de los sistemas de base de datos
podemos mencionar:
Independencia lógica y física de los datos.
Redundancia mínima.
Acceso concurrente por parte de múltiples usuarios.
Integridad de los datos.
Consultas complejas optimizadas.
Seguridad de acceso y auditoría.
Respaldo y recuperación.
Acceso a través de lenguajes de programación estándar.
Un sistema de administración de bases de datos (DBMS, Database
Management System) integrado en el sistema CNAPSI proporciona los
mecanismos necesarios para almacenar, organizar, obtener y modificar
datos para muchos usuarios. Los sistemas de administración de bases de
datos permiten el acceso y almacenamiento de datos sin necesidad de
preocuparse por su representación interna. Proporciona una forma de
almacenar y recuperar la información de una base de datos de forma
práctica y eficiente
16
.
Se puede representar la estructura del DBMS de CNAPSI de la
siguiente forma:
16
M. J. Donahoo, SQL. Practical Guide for Developers, USA: Morgan Kaufmann Elsevier Inc,
2005, pp. 2-3.
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
138
Skopos 3 (2013),
133
-
1
50
El nivel interno es el más cercano al almacenamiento físico, es decir,
es el relacionado con la forma en que los datos están realmente
almacenados. El nivel externo es el más cercano a los usuarios, por lo tanto
es el relacionado con la forma en que los datos son vistos por cada usuario
individualmente. El nivel lógico global es un nivel intermedio entre los dos
anteriores.
En la actualidad, los sistemas de bases de datos más populares son
las bases de datos relacionales. En el proyecto CNAPSI el lenguaje
empleado en su creación es SQL (lenguaje de consulta estructurado o
Structured Query Language) pues es el estándar internacional que se utiliza
casi universalmente con las bases de datos relacionales para realizar
consultas y manipular datos. Dentro de estos estándares se ha optado por
el sistema de administración de bases de datos relacionales MySQL
17
, el
cual es un motor de base de datos relacional, muy rápido, multihilo,
multiusuario y robusto, ampliamente utilizado no sólo en proyectos de
software libre, sino también en multitud de desarrollos comerciales
18
, ya que
dispone de dos versiones, una comercial y otra libre con licencia GNU GPL
(del inglés GNU General Public License, Licencia Pública General de
GNU)
19
. Hasta abril de 2009 pertenecía a Sun Microsystems, pero en esa
fecha ha pasado a formar parte de Oracle, ya que ésta empresa ha
adquirido a Sun Microsystems, por lo que se ha optado por mantener este
sistema que permite tanto aprovechar los logros e implementaciones del
Software Libre y el mantenimiento del software propietario.
2.2. Normalización
Debemos normalizar la BBDD del CNAPSI para que no haya
redundancia superflua. La teoría de la normalización se ha desarrollado
para obtener estructuras de datos eficientes que eviten las anomalías de
actualización. El concepto de normalización fue introducido por E.D. Codd
20
para aplicarse a sistemas relacionales. La normalización es la expresión
formal del modo de realizar un buen diseño pues provee los medios
necesarios para describir la estructura lógica de los datos en un sistema de
información.
17
T. Converse, PHP 5 and MySQL Bible, USA: Wiley Publishing, 2004, pp 245-247.
18
A. Cobo, PHP y MySQL: tecnologías para el desarrollo de aplicaciones web, Madrid:
Ediciones Díaz de Santos, 2007, pp 339-341.
19
GNU es un acrónimo recursivo que significa GNU No es Unix, proyecto iniciado en 1983 por
Richard Stallman, con el objetivo de crear un sistema operativo completamente libre.
20
E. F. Codd, A Relational Model of Data for Shared Data Banks, USA: IBM Research
Laboratory, 1970.
Monferrer
Sala / Guerrero Carmona/ Marcos Aldón
139
Skopos 3 (2013),
133
-
1
50
La normalización convierte una relación en varias sub-relaciones,
cada una de las cuales obedece a reglas. Estas reglas se describen en
términos de dependencia. Una vez que hayamos examinado las distintas
formas de dependencia, encontraremos procedimientos a aplicar a las
relaciones de modo tal que las mismas puedan descomponerse de acuerdo
a la dependencia que prevalece. Esto nos llevará indefectiblemente a formar
varias sub-relaciones a partir de la única relación preexistente.
2.3. Metodología para el diseño de bases de datos de CNAPSI
Determinación de entidades y atributos
Normalización de entidades
Determinación de relaciones (DER)
Obtención del modelo lógico global de los datos
Diseño físico de la base de datos
Cuando se va a realizar el diseño de la base de datos para un
sistema, es necesario determinar los datos que se deben tomar en cuenta y
las dependencias funcionales existentes entre ellos.
Después de la normalización, las tablas de la base de datos, así
como las relaciones entre ellas, son las siguientes:
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
140
Skopos 3 (2013),
133
-
1
50
2.4. Ejemplo de la aplicación.
Una vez realizada la base de datos, normalizadas las tablas y
llevadas a la Web, la página inicial de la aplicación se divide en:
una cabecera en la parte superior
los menús para realizar búsquedas en cada una de las tablas
la zona principal en la que aparece el texto y las imágenes
la parte lateral derecha en la que aparecen enlaces de interés e
información de contacto
Monferrer
Sala / Guerrero Carmona/ Marcos Aldón
141
Skopos 3 (2013),
133
-
1
50
Como ejemplo, se muestra el resultado de una búsqueda:
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
142
Skopos 3 (2013),
133
-
1
50
2.5. Planificación del proyecto.
En un proyecto de esta envergadura se debe realizar una
planificación adecuada, ajustada y realista, teniendo en cuenta los recursos
materiales y humanos, así como el esfuerzo requerido para que se cumplan
los plazos establecidos y se lleve a cabo en el tiempo acordado. La
programación del proyecto es la siguiente:
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
143
Skopos 3 (2013),
133
-
150
3. Modelización de datos y herramientas auxiliares.
Para llevar a cabo este proyecto en el Laboratorio de Ingeniería
Documental de la Universidad de Córdoba (LabInDoc) se desarrollaron
modelos que se sustentaban en diferentes formas en las que se tratan la
representación, almacenamiento, organización y acceso de items de
información, generalmente documental y ofrecer al usuario sugerencias
específicas sobre items o acciones dentro de un dominio específico
21
.
Entre los sistemas de integración de datos hemos optado en la
implantación en CNAPSI de un sistema de recomendación, es decir, una
herramienta construida sobre la implicación de una red bayesiana: este tipo
de sistemas de recomendación consta de dos componentes a) uno
cualitativo, representado por un grafo dirigido y acíclico compuesto por
nodos que representan las variables aleatorias del problema que se desea
resolver, y arcos que indican causalidad, relevancia o relaciones de
dependencia entre variables, y (b) otro cuantitativo, codificado mediante
distribuciones de probabilidad condicionadas. Éstas permiten cuantificar
nuestra incertidumbre sobre las relaciones existentes entre las variables del
problema. Resolviendo así los problemas entrópicos.
Por tanto, formalmente, una red bayesiana puede considerarse como
una representación muy eficiente de una distribución de probabilidad
conjunta, que tiene en cuenta las relaciones de independencia condicional
codificadas en el grafo; la distribución de probabilidad conjunta puede
obtenerse a partir de las distribuciones condicionales mediante:
Estos trabajos se fundamentan en labores básicas de desarrollo en
recuperación de información probabilística, en los que se integran
algoritmos y funciones de agrupamiento con formalismos de Fuzzy Logic,
formalismos que hasta el momento no han sido utilizados para tratar la
incertidumbre intrínseca inherente a multitud de problemas de
21
Baeza-Yates, R. A., and Ribeiro-Neto, B. (2010). Modern Information Retrieval (2nd ed.).
Reading, Massachusetts: Addison-Wesley; Croft, W. B., Metzler, D., and Strohman, T. (2010).
Search Engines: Information Retrieval in Practice. London, England: Pearson.; Grossman, D.
A., and Frieder, O. (2004). Information Retrieval: Algorithms and Heuristics (2nd ed.). Berlin,
Germany: Springer; Hearst, M. A. (2009). Search User Interfaces. Cambridge, England:
Cambridge University Press; Manning, C. D., Raghavan, P., and Schütze, H. (2008).
Introduction to Information Retrieval. Cambridge, England: Cambridge University Press;
Manning, C. D., and Schütze, H. (1999). Foundations of Statistical Natural Language
Processing. Cambridge, Massachusetts: MIT Press; Özsu, M. T., and Liu, L., editors (2009).
Encyclopedia of Database Systems. Berlin, Germany: Springer.
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
144
Skopos 3 (2013),
133
-
150
documentación literaria y se ha escogido para ello un desarrollo de redes
bayesianas y en la modificación del algoritmo de recuperación naïve-Bayes,
obteniendo un nuevo sistema más voraz y eficaz, aunque en un principio, su
empleo depende de la evaluación de las fuentes de datos que se han
empleado
22
.
Esquema de configuración del algoritmo semi naïve-Bayes empleado
Para desarrollar el algoritmo se utilizaron variaciones de métodos ya
establecidos teniendo siempre presente que en nuestro caso no es una
recuperación de datos sino una aproximación de probabilidades así que se
empleó un desarrollo de inferencia estadística, los dos problemas
fundamentales que estudia la inferencia estadística son el problema de la
estimación y el problema del contraste de hipótesis
23
.
La estimación de un parámetro involucra el uso de los datos
muéstrales en conjunción con alguna estadística. Existen dos formas de
llevar a cabo lo anterior: estimación puntual y estimación por intervalo. En la
primera se busca un estimador, que, con base en los datos muéstrales, de
origen a una estimación del valor del parámetro, y que recibe el nombre de
estimador puntual. Para la segunda, se determina un intervalo en el que, en
forma probable, se encuentra el valor del parámetro. Este intervalo recibe el
22
Artandi, S., “Information Concepts and Their Utility”, Journal of the American Society for
Information Science, 24 (1973), pp. 242-245 Baird, J.C., Information Theory and Information
Processing. Information Processing & Management 20:3 (1984), pp. 373-381; Belkin, N.J.,
“Some Soviet Concepts of Information for Information Science”, Journal of the American Society
for Information Science 26 (1975), pp. 56-64; Belkin, N.J., “Information Concepts for Information
Science”, Journal of Documentation 34 (1978), pp. 55-85; Beniger, J.R., Information and
Communication: The New Convergence. Communication Research 15:2 (1988), pp. 198-218.
23
Roberts, N., “Social Considerations Towards a Definition of Information Science”, Journal of
Documentation 32 (1976), pp. 249-257.
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
145
Skopos 3 (2013),
133
-
150
nombre de intervalo de confianza estimado. Es importante observar que el
estimador no es un valor concreto sino una variable aleatoria, ya que
aunque depende unívocamente de los valores de la muestra observados, la
elección de la muestra es un proceso aleatorio en nuestro caso, pues se
pensó en el desarrollo de un validador para uso indiscriminado y no
especializado
En nuestro caso las variables aleatorias se obtuvieron del proceso de
peso de los sinónimos que se validaron utilizando variaciones de fuzzy-
logic. Las características deseables eran: consistencia, cuando el tamaño
de la muestra crece arbitrariamente, el valor estimado se aproximaba al
parámetro desconocido; carencia de sesgo: el valor medio que se obtenía
de la estimación para diferentes muestras era el valor del parámetro;
eficiencia: buscaba que la dispersión del estimador con respecto al valor
central, es decir, la varianza, sea tan pequeña como sea posible;
suficiencia: el estimador debería aprovechar toda la información existente
en la muestra.
El sistema intuitivo está definido por la función:
3.1. Posicionamiento y difusion.
La propagación de evidencia, es decir, el cálculo de las
probabilidades a posteriori de todas o algunas de las variables (o incluso de
las distribuciones conjuntas de grupos de variables), dada alguna evidencia
o conocimiento relativo a los valores que han tomado determinadas
variables (las cuales se dice que han sido instanciadas) alcanzará en
nuestro caso en torno al 94-96%. La realidad de difusión optima se
encuentra entre el 75-86% por lo cual nuestra opción de page rank es
extremadamente óptima. Existen diversos algoritmos que realizan este
proceso de propagación de la forma más eficiente posible, que depende en
gran medida de la topología del grafo
24
.
24
Marchionini, G. - G. Crane, G., “Evaluating Hypermedia and Learning: Methods and Results
from the Perseus Project”, ACM Transactions on Information Systems 12:1 (1994), pp. 5-34.
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
146
Skopos 3 (2013),
133
-
150
Categorías del algoritmo de aproximación según el método Markov
Existen modelos sobre el algoritmo ya empleados que se han
utilizado como el enfoque APNBC (Adjusted Probability Naïve-Bayesian
Induction) realiza un ajuste lineal del peso de la probabilidad de cada
término. De esta forma, se asigna un factor de ajuste a cada término y
documento, y la probabilidad estimada para cada atributo se multiplica por
este factor. Los pesos relativos a cada término se buscan a través de un
algoritmo voraz guiado por el tanto por ciento de bien clasificados, el cual se
obtiene por el método de resustitución
25
.
A través de WenBay (Weighted naïve-Bayes) se permite asociar
pesos a particiones pero con una adecuada modificación permite asociar los
pesos a los elementos instanciados en los documentos y en sus particiones,
en lugar de a cada clase. Las instancias de cada variable predictora son
particionadas de manera recursiva con el objetivo de maximizar la entropía
3.2. Control de información.
Puesto que la información generada por el sistema existente ha ido
en función de todas las actividades completadas en las diversas fases del
ciclo de desarrollo del sistema, es preciso prestar especial atención a cada
fase en lo que respecta a cualquier posibilidad de mejora de la calidad de la
información
26
.
25
Bellman, R.E. - R. Kalaba - L.A. Zadeh, Abstraction and pattern classification. RAND Memo,
RM-4307-PR. [Online] RAND. Consulta realizada el 27/02/2010.
26
Xie, H., “Shifts of Interactive Intentions and Information-Seeking Strategies in Interactive
Information Retrieval”, Journal of the American Society for Information Science 51:9 (2000), pp.
841-857.
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
147
Skopos 3 (2013),
133
-
150
Para lograr un control de autoridades en los procesos de
recomendación hemos sistematizado según Souza todos los elementos
descriptores, para ello se presentan de forma sistemática en nueve facetas
y otra alfabética. Para analizar otros elementos relacionados con la Gestión
de Calidad Total de los Datos, teniendo como norte que partíamos de un
control terminológico exhaustivo con fuentes de reconocida fiabilidad como
hemos referido anteriormente, empleamos la gestión transversal de los
datos en consulta con Integrity Analizer (IA). Es uno de los productos
resultado de los estudios realizados por MIT en materia de gestión de la
calidad total de los datos (TDQM), que presenta una metodología TDQM en
la que se combinan los principios del ciclo aplicable a este tipo de gestión
con los correspondientes a las restricciones de integridad en las bases de
datos relacionales:
Filiaciones: habitualmente, las herramientas de contextualización no
identifican la filiación de todos y cada uno de los términos de un artículo.
Esta es la información que lógicamente puede ofrecer esta herramienta. No
obstante es posible identificar la filiación de la mayor parte de términos
haciendo un barrido de la base de datos simultáneo a los vocabularios
maestros de materias, autores, centros y países, etc.
Para cada período se pueden establecer propiedades particulares del
vocabulario, tales como número de descriptores y las características de la
lista: libre, truncada o redondeada. Además debe elegirse la ocurrencia
mínima de los descriptores y la co-ocurrencia también mínima que deben
poseer los enlaces candidatos para formar parte de la contextualización.
Jugando con estos valores es posible obtener resultados verdaderamente
interesantes y explicativos
El Integrity Analyzer funcionó tanto con las restricciones formales de
integridad de Codd como con las restricciones definidas por el usuario. La
evaluación de la integridad de dominio, de columna, de entidad y referencial
permanecieron sin cambios en todas las aplicaciones. Todos los sistemas
de gestión de base de datos relacionales, de forma idónea, deberían seguir
estas normas. Asimismo, todas las bases de datos, al margen del tema que
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
148
Skopos 3 (2013),
133
-
150
recojan, deberían adherirse a las normas que imponen este tipo de
restricciones.
Referencias bibliográficas
A
RTANDI
, S. (1973): “Information Concepts and Their Utility”, Journal of the
American Society for Information Science, 24, 242-245.
B
AEZA
-Y
ATES
, R. A.; R
IBEIRO
-N
ETO
, B. (2010): Modern Information Retriev.
Reading, Mass: Addison-Wesley.
B
AIRD
, J.C. (1984): Information Theory and Information Processing.
Information Processing & Management 20:3, 373-381.
B
EESTON
, A.F.L. (1973): The Inscription Jaussen-Savignac 71”,
Proceedings of the Seminar for Arabian Studies 3, 69-72.
B
ELKIN
, N.J. (1978): “Information Concepts for Information Science”, Journal
of Documentation 34, 55-85.
_____
(1975):
“Some Soviet Concepts of Information for Information
Science”, Journal of the American Society for Information Science 26,
56-64.
B
ELLAMY
, J. (1985): A New Reading of the Namārah Inscription”, Journal of
the American Oriental Society 105/1, 31-74.
B
ELLMAN
, R.E.; K
ALABA
R.; Z
ADEH
, L. A.:, Abstraction and pattern
classification. RAND Memo, RM-4307-PR. [Online] RAND. COnsulta
realizada el 27/02/2010.
B
ENIGER
, J.R. (1988): Information and Communication: The New
Convergence. Communication Research 15:2, 198-218.
C
ANTINEAU
, J. (1978
2
) : Le nabatéen. 2 vols., Osnabrück: Otto Zeller. (=
Paris, 1930-32).
C
ASKEL
, W. (1969): “Die Inschrift von en-Nemāra- Neu gesehen”, Mélanges
de l’Université St. Joseph 45, 367-379.
C
OBO
, A. (2007): PHP y MySQL: tecnologías para el desarrollo de
aplicaciones web, Madrid: Ediciones Díaz de Santos.
C
ODD
, E.F. (1970): A Relational Model of Data for Shared Data Banks, USA:
IBM Research Laboratory.
C
ONVERSE
, T. (2004): PHP 5 and MySQL Bible, USA: Wiley Publishing.
C
ORRIENTE
, F. (2005): “The Phonemic System of Semitic from the
Advantage Point of Arabic and its Dialectology”, Aula Orientalis 23,
169-173.
C
ROFT
, W. B. (2010): Metzler, D. - T. Strohman, Search Engines:
Information Retrieval in Practice. London: Pearson.
D
ONAHOO
, M.J. (2005): SQL. Practical Guide for Developers, USA: Morgan
Kaufmann Elsevier Inc.
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
149
Skopos 3 (2013),
133
-
150
D
RIJVERS
, H.J.W.; H
EALEY
, J. F. (1998): The Old Syriac Inscriptions of
Edessa and Osrhoene. Texts, Translations, and Commentary, Leiden:
E. J. Brill.
D
RIJVERS
, H.J.W. (1972): Old Syriac (Edessan) Inscriptions, Leiden: E. J.
Brill, 1972
G
RAF
, D. F. (1990): “The Origin of the Nabateans”, Aram 2, 59-68.
G
ROSSMAN
, D. A.; F
RIEDER
, O. (2004): Information Retrieval: Algorithms and
Heuristics, Berlin: Springer. 2.ª ed.
H
EARST
, M.A. (2009): Search User Interfaces. Cambridge: Cambridge
University Press.
L
ITTMANN
, E. (1949): Semitic Inscriptions, Leyden: E. J. Brill, IV/A, 37-40,
41.
M
ACDONALD
, M.C.A., “Ancient North Arabian”, en Roger D. Woodard (ed.),
The Ancient Languages of Syria-Palestine and Arabia, Cambridge:
Cambridge University Press, 179-224.
M
ANNING
, C. D.; R
AGHAVAN
, P.; S
CHÜTZE
, H. (2008): Introduction to
Information Retrieval, Cambridge: Cambridge University Press.
M
ANNING
, C.D.; S
CHÜTZE
, H. (1999): Foundations of Statistical Natural
Language Processing, Cambridge, Mass.: MIT Press.
M
ARCHIONINI
, G.; C
RANE
, G. (1994): Evaluating Hypermedia and Learning:
Methods and Results from the Perseus Project”, ACM Transactions
on Information Systems 12:1, 5-34.
M
ÜLLER
, W. (1986): “Das Altarabische und das Klassische Arabisch”, en
F
ISCHER
, W.– G
ÄTJE
, H. (eds.), Grundriss der arabischen Philologie. I.
Sprachwissenschaft, Wiesbaden: Ludwig Reichert, 1982, pp. 26-28.
O’Connor, M., “The Arabic Loanwords in Nabatean Aramaic”, Journal of
Near Eastern Studies 45, 213-229.
Ö
ZSU
, M. T.; Liu, E. (2009, eds.): Encyclopedia of Database Systems, Berlin:
Springer.
R
ABIN
, Ch. (1951): Ancient West-Arabian, London: Taylor’s Foreign Press.
R
ÍO
S
ÁNCHEZ
, F. (2006): del, Textos epigráficos en arameo palmireno,
hatreo y nabateo, «Estudios de Filología Semítica» 6, Barcelona:
Universitat de Barcelona.
R
OBERTS
, N. (1976): “Social Considerations Towards a Definition of
Information Science”, Journal of Documentation 32, 249-257.
R
OBIN
, Ch. (1991-93): L’arabie antique de Karib’īl à Mahomet: nouvelles
donnnées sur l’histoire des Arabes grâce aux inscriptions, Aix-en-
Provence: Edisud.
R
OSENTHAL
, F. (1967, ed.): An Aramaic Handbook. 4 vols., Wiesbaden: Otto
Harrassowitz.
S
HAHÎD
, I. (1979): “Philological Observations on the Namāra Inscription”,
Journal of Semitic Studies 24, 33-42.
Monferrer Sala / Guerrero Carmona/ Marcos Aldón
150
Skopos 3 (2013),
133
-
150
S
TARCKY
, J. (1955): “The Nabataeans: a historical sketch”, Biblical
Archaeologist 18, 924-926.
X
IE
, H. (2000): “Shifts of Interactive Intentions and Information-Seeking
Strategies in Interactive Information Retrieval”, Journal of the
American Society for Information Science 51:9, 841-857.