{"id":19241,"date":"2021-09-14T17:20:28","date_gmt":"2021-09-14T15:20:28","guid":{"rendered":"https:\/\/www.hiberus.com\/crecemos-contigo\/?p=19241"},"modified":"2023-12-14T23:00:59","modified_gmt":"2023-12-14T22:00:59","slug":"herramientas-para-el-tratamiento-de-duplicacion-de-datos","status":"publish","type":"post","link":"https:\/\/www.hiberus.com\/crecemos-contigo\/herramientas-para-el-tratamiento-de-duplicacion-de-datos\/","title":{"rendered":"Herramientas para el tratamiento de duplicaci\u00f3n de datos"},"content":{"rendered":"<p>El reconocimiento de duplicados consiste en la identificaci\u00f3n de registros referentes a una misma entidad sin la ayuda de identificadores un\u00edvocos.<\/p>\n<p>Este problema se puede clasificar dependiendo de la naturaleza de los datos en:<\/p>\n<ul>\n<li><strong>Deduplicaci\u00f3n<\/strong>: si los datos provienen de una misma base de datos.<\/li>\n<li><strong>Vinculaci\u00f3n de registros<\/strong>: si los datos provienen de distintas bases de datos, cada una de las cuales no tienen registros duplicados por s\u00ed mismas.<\/li>\n<li><strong>Resoluci\u00f3n de entidades<\/strong>: si se tienen datos de distintas fuentes y, adem\u00e1s, hay duplicados dentro de cada una de ellas.<\/li>\n<\/ul>\n<p>Esta clasificaci\u00f3n del problema puede permitir <strong>definir condiciones l\u00f3gicas sobre los registros a comparar, de tal manera que se reduzca el espacio de b\u00fasqueda<\/strong> del problema. Por ejemplo, en el caso de la deduplicaci\u00f3n de datos se puede usar la condici\u00f3n de transitividad. Es decir si dos registros son catalogados como duplicados y un tercer registro resulta ser duplicado del segundo, entonces tambi\u00e9n ha de ser duplicado del primero.<\/p>\n<p>En el caso de la <strong>vinculaci\u00f3n de registros<\/strong> resulta importante la exclusividad. Es decir si dos registros de dos bases de datos son duplicados, entonces no puede haber m\u00e1s duplicados si cada base de datos respeta la unicidad de sus registros.<\/p>\n<p>En general se pueden aprovechar diversas condiciones sobre los datos m\u00e1s all\u00e1 de la clasificaci\u00f3n del problema. Estas condiciones muchas veces van a depender de la <strong>naturaleza de los datos<\/strong>. Por ejemplo:<\/p>\n<ul>\n<li>Si se tienen <strong>dos bases de datos en un problema de vinculaci\u00f3n<\/strong>, cada una de las cuales tiene una tabla de papers y una tabla de autores y se encuentra que un paper es duplicado de otro, entonces necesariamente los autores de esos papers han de ser duplicados tambi\u00e9n.<\/li>\n<li>En un <strong>problema de deduplicaci\u00f3n<\/strong> puede haber un n\u00famero m\u00e1ximo de duplicados.<\/li>\n<li>Puede haber columnas que sirvan como <strong>identificadores parciales<\/strong>.<\/li>\n<\/ul>\n<p>Luego de haber generado las condiciones para delimitar el espacio de b\u00fasqueda, generalmente estos algoritmos se valen de <strong>reglas de similitud entre los registros para poder clasificar todos los pares<\/strong>\u00a0de manera probabil\u00edstica, en inciertos, duplicados y distintos.<\/p>\n<div id=\"attachment_19250\" style=\"width: 420px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-19250\" class=\"wp-image-19250\" src=\"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/duplicados-ejemplo-pacientes.png\" alt=\"duplicaci\u00f3n de datos\" width=\"410\" height=\"199\" srcset=\"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/duplicados-ejemplo-pacientes.png 709w, https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/duplicados-ejemplo-pacientes-300x146.png 300w, https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/duplicados-ejemplo-pacientes-360x175.png 360w\" sizes=\"auto, (max-width: 410px) 100vw, 410px\" \/><p id=\"caption-attachment-19250\" class=\"wp-caption-text\">Ejemplo de vinculaci\u00f3n de pacientes.<\/p><\/div>\n<h2>Desaf\u00edos espec\u00edficos a la miner\u00eda de datos en el reconocimiento de duplicados<\/h2>\n<p>Para poder aplicar exitosamente estos procedimientos t\u00edpicamente estos algoritmos tienen que enfrentarse a problemas comunes en la IA y la miner\u00eda de datos:<\/p>\n<ul>\n<li>Ambig\u00fcedad en cuanto a los atributos.<\/li>\n<li>Errores durante la entrada de datos.<\/li>\n<li>Valores faltantes.<\/li>\n<li>Atributos cambiantes.<\/li>\n<li>Formato de datos.<\/li>\n<li>Abreviaturas.<\/li>\n<li>Truncamiento.<\/li>\n<\/ul>\n<p>Para poder enfrentar estos problemas resulta de suma importancia <strong>dise\u00f1ar e implementar una pol\u00edtica de preprocesamiento de datos que no induzca falsos positivos<\/strong>.<\/p>\n<h2>Desaf\u00edos espec\u00edficos a la ingenier\u00eda de datos en la deduplicaci\u00f3n<\/h2>\n<p>Adicionalmente, si bien el conjunto original de datos puede no ser grande, el conjunto de pares de registros implica un <strong>espacio del orden de O(N2)<\/strong> que s\u00ed puede ser desafiante. Esto ocurre porque la deduplicaci\u00f3n de datos es como m\u00ednimo un cruce de una tabla consigo misma. Por ello, se tienen los siguientes desaf\u00edos:<\/p>\n<ul>\n<li><strong>Complejidad en tiempo y espacio<\/strong> de O(N2) para un conjunto de datos de tama\u00f1o N.<\/li>\n<li>Conjuntos de <strong>pares grande<\/strong>.<\/li>\n<li>Datos no estructurados e incompletos. Por ejemplo, si hay texto.<\/li>\n<li><strong>Necesidad de extraer relaciones diferentes a la igualdad<\/strong>. Esto suele ocurrir si las condiciones l\u00f3gicas de filtro vienen dadas por desigualdades o por condicionales.<\/li>\n<li><strong>M\u00faltiples relaciones<\/strong>. Por ejemplo, si las bases de datos a deduplicar tienen m\u00e1s de una tabla.<\/li>\n<li><strong>M\u00faltiples dominios<\/strong>. Esto puede ocurrir si las bases de datos proceden de modelos de negocio totalmente distintos. Por ejemplo, una base de datos de pacientes y una base de datos de registros civiles.<\/li>\n<li>M\u00faltiples aplicaciones con <strong>distintas necesidades<\/strong>. Esto resulta relevante si se tiene en cuenta que los resultados de los algoritmos de deduplicaci\u00f3n suelen arrojar una certeza en sus resultados.<\/li>\n<\/ul>\n<p>En este caso para poder enfrentar estos problemas resulta fundamental la elecci\u00f3n de las herramientas de trabajo. Adicionalmente, el dise\u00f1o de las condiciones l\u00f3gicas de filtro es probablemente el aspecto m\u00e1s importante del proceso, pues esto <strong>contribuye a reducir el n\u00famero de pares de registros que se comparan<\/strong>. A este proceso se le conoce como <strong>blocking<\/strong>.<\/p>\n<div id=\"attachment_19251\" style=\"width: 420px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-19251\" class=\"wp-image-19251\" src=\"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/blocking-duplicados.png\" alt=\"\" width=\"410\" height=\"196\" \/><p id=\"caption-attachment-19251\" class=\"wp-caption-text\">Cantidad de pares a considerar antes de las reglas de filtro y despu\u00e9s de aplicarlas<\/p><\/div>\n<p>&nbsp;<\/p>\n<h2>Herramientas, algoritmos y t\u00e9cnicas para la duplicaci\u00f3n de datos<\/h2>\n<h3>Blocking<\/h3>\n<p>Son t\u00e9cnicas aplicadas directamente sobre el conjunto de registros para poder <strong>delimitar los pares de estos que pueden ser comparados<\/strong>. Generalmente estas t\u00e9cnicas se valen de identificadores parciales, sin embargo es posible aplicar diversos tipos de algoritmos de IA o incluso m\u00e9tricas como TF-IDF.<\/p>\n<h3>Paquetes<\/h3>\n<p>La mayor\u00eda de los paquetes usados para la deduplicaci\u00f3n de datos resulta experimental. Adicionalmente, de los paquetes que <strong>son suficientemente maduros como para poder ser usados en producci\u00f3n<\/strong>, no todos son escalables o implementan algoritmos de aprendizaje poderosos.<\/p>\n<p>A continuaci\u00f3n se mencionar\u00e1n algunos ejemplos.<\/p>\n<h4>Splink<\/h4>\n<p>Este es un paquete implementado para <a href=\"https:\/\/www.hiberus.com\/crecemos-contigo\/mas-alla-de-pandas-y-apache-spark-para-la-manipulacion-de-datos-apache-arrow-y-gpu\/\"><strong>Apache Spark<\/strong><\/a> que implementa una versi\u00f3n del modelo <strong>Fellegi-Sunter<\/strong> y usa el algoritmo <strong>Expectation Maximization<\/strong> para aprender de manera no supervisada sus par\u00e1metros.<\/p>\n<p><strong>La principal ventaja de este paquete es su escalabilidad y lo simple que resulta su uso<\/strong> debido a que es no supervisado. Adicionalmente, fue implementado para el Gobierno brit\u00e1nico, lo cual permite asegurar que el proyecto seguir\u00e1 siendo mantenido. Por otro lado su principal desventaja es que este modelo a<strong>sume la independencia estad\u00edstica de sus atributos<\/strong>.<\/p>\n<h4>Dedupe<\/h4>\n<p>Es un paquete implementado para Python que se vale de datos etiquetados y aprendizaje activo para poder entrenar sus modelos. A diferencia de Splink, este paquete <strong>no cuenta con una plataforma de <a href=\"https:\/\/www.hiberus.com\/crecemos-contigo\/tag\/big-data\/\">Big Data<\/a> para distribuir sus tareas<\/strong>. Sin embargo, es posible usar esta herramienta con cursores conectados a bases de datos para evitar sobrecargar la memoria durante sus c\u00e1lculos .<\/p>\n<p>Su principal ventaja radica en sus <strong>algoritmos de aprendizaje para los bloques y las reglas de comparaci\u00f3n<\/strong>. Presenta una desventaja\u00a0 que radica en la complejidad con la que se pueden sortear sus problemas de escalabilidad.<\/p>\n<h4>Duke<\/h4>\n<p>Es una <strong>plataforma implementada en Java<\/strong> que se vale de conectores a bases de datos y motores de indexaci\u00f3n para deduplicar registros. Entre sus ventajas est\u00e1 su eficiencia debida al uso de Lucene y su principal desventaja es, al igual que Splink, su dependencia a las hip\u00f3tesis estad\u00edsticas .<\/p>\n<div id=\"attachment_19252\" style=\"width: 420px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-19252\" class=\"wp-image-19252\" src=\"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/duke-300x173.png\" alt=\"\" width=\"410\" height=\"236\" srcset=\"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/duke-300x173.png 300w, https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/duke-360x207.png 360w, https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/duke.png 753w\" sizes=\"auto, (max-width: 410px) 100vw, 410px\" \/><p id=\"caption-attachment-19252\" class=\"wp-caption-text\">Arquitectura de Duke<\/p><\/div>\n<h4>JedAI<\/h4>\n<p>Es una plataforma gr\u00e1fica i<strong>mplementada en Java y que puede ser usada con <a href=\"https:\/\/www.hiberus.com\/crecemos-contigo\/mas-alla-de-pandas-y-apache-spark-para-la-manipulacion-de-datos-apache-arrow-y-gpu\/\">Spark<\/a> y Docker<\/strong>. Entre sus principales ventajas est\u00e1 la disponibilidad de varios algoritmos basados en el Estado del Arte, su interfaz de usuario y su capacidad de trabajar con datos no estructurados.<\/p>\n<p>Su principal desventaja es que requiere de un \u201c<strong>Golden Standard<\/strong>\u201d, adem\u00e1s de los datos a deduplicar.<\/p>\n<div id=\"attachment_19253\" style=\"width: 235px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-19253\" class=\"wp-image-19253\" src=\"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/Jedai-286x300.png\" alt=\"\" width=\"225\" height=\"236\" srcset=\"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/Jedai-286x300.png 286w, https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/Jedai-360x378.png 360w, https:\/\/www.hiberus.com\/crecemos-contigo\/wp-content\/uploads\/2021\/09\/Jedai.png 540w\" sizes=\"auto, (max-width: 225px) 100vw, 225px\" \/><p id=\"caption-attachment-19253\" class=\"wp-caption-text\">Arquitectura de JedAI<\/p><\/div>\n<h2>Ejemplo: deduplicaci\u00f3n de inmuebles entre portales inmobiliarios<\/h2>\n<p>Se cuenta con cantidades ingentes de datos provenientes de varios portales de anuncios <strong>inmobiliarios en GCP<\/strong>. Un mismo inmueble puede ser ofertado varias veces en:<\/p>\n<ul>\n<li>Distintos portales.<\/li>\n<li>En el mismo portal, usualmente de manera adversativa en contra de las normativas de \u00e9ste.<\/li>\n<\/ul>\n<h3>Problema:<\/h3>\n<p>Identificar cu\u00e1les registros corresponden a la misma propiedad para poder, as\u00ed, contar con datos fiables que puedan ser usados en procesos anal\u00edticos partiendo de <strong>BigQuery y GCS<\/strong>.<\/p>\n<h3>Soluci\u00f3n:<\/h3>\n<p>Se puede implementar un <strong>Workflow Template en Dataproc con una tarea de PySpark<\/strong>. Esta tarea contar\u00eda con un paquete de vinculaci\u00f3n de registros no supervisado llamado Splink. Entre las razones por las que se podr\u00eda usar Splink, tenemos:<\/p>\n<ul>\n<li>El volumen de los datos presupone que se requiere una herramienta de Big Data como Apache Spark.<\/li>\n<li>Preferencia por Python.<\/li>\n<li>Practicidad y rapidez en cuanto al uso de un m\u00e9todo no supervisado.<\/li>\n<\/ul>\n<h3>Desaf\u00edos:<\/h3>\n<p>Al igual que cualquier proyecto similar, uno de los mayores desaf\u00edos podr\u00eda consistir en la <strong>baja granularidad de los datos en cuanto a pisos construidos en una misma planta o en un mismo edificio<\/strong>. En estos casos un mismo usuario de los portales inmobiliarios podr\u00eda repetir la informaci\u00f3n de estos.<\/p>\n<p>Adicionalmente si no se cuentan con campos para distinguir sus puertas, entonces resultar\u00eda imposible no detectarlos como distintos.<\/p>\n<p>En Hiberus contamos con un \u00e1rea de especializada en el an\u00e1lisis y tratamiento de datos, <a href=\"https:\/\/www.hiberus.com\/data-ia\/data-insights\">Data &amp; Analytics<\/a>. Somos expertos en inteligencia artificial, machine learning y deep learning.<\/p>\n        <div class=\"row\">\n            <div class=\"block-cta-form\" style=\"background-color: #003664;\">\n                <div class=\"content-cta-form\">\n                    <div class=\"text-cta-form\">\n                        <p class=\"title-cta-form\">\u00bfQuieres m\u00e1s informaci\u00f3n sobre nuestros servicios de Data &amp; Analytics?<\/p>\n                        <p>Contacta con nuestro equipo de expertos en Data &amp; Analytics<\/p>\n                    <\/div>\n                    <div class=\"form-fields\">\n                        \n<div class=\"wpcf7 no-js\" id=\"wpcf7-f33973-o1\" lang=\"es-ES\" dir=\"ltr\" data-wpcf7-id=\"33973\">\n<div class=\"screen-reader-response\"><p role=\"status\" aria-live=\"polite\" aria-atomic=\"true\"><\/p> <ul><\/ul><\/div>\n<form action=\"\/crecemos-contigo\/wp-json\/wp\/v2\/posts\/19241#wpcf7-f33973-o1\" method=\"post\" class=\"wpcf7-form init\" aria-label=\"Formulario de contacto\" novalidate=\"novalidate\" data-status=\"init\">\n<fieldset class=\"hidden-fields-container\"><input type=\"hidden\" name=\"_wpcf7\" value=\"33973\" \/><input type=\"hidden\" name=\"_wpcf7_version\" value=\"6.1.5\" \/><input type=\"hidden\" name=\"_wpcf7_locale\" value=\"es_ES\" \/><input type=\"hidden\" name=\"_wpcf7_unit_tag\" value=\"wpcf7-f33973-o1\" \/><input type=\"hidden\" name=\"_wpcf7_container_post\" value=\"0\" \/><input type=\"hidden\" name=\"_wpcf7_posted_data_hash\" value=\"\" \/><input type=\"hidden\" name=\"_wpcf7_recaptcha_response\" value=\"\" \/>\n<\/fieldset>\n<div id=\"responsive-form\" class=\"clearfix\">\n\t<div class=\"form-row\">\n\t\t<div class=\"column-half\">\n\t\t\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"nombre\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-text wpcf7-validates-as-required\" aria-required=\"true\" aria-invalid=\"false\" placeholder=\"Nombre *\" value=\"\" type=\"text\" name=\"nombre\" \/><\/span>\n\t\t\t<\/p>\n\t\t<\/div>\n\t\t<div class=\"column-half\">\n\t\t\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"apellido\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-text wpcf7-validates-as-required\" aria-required=\"true\" aria-invalid=\"false\" placeholder=\"Apellido *\" value=\"\" type=\"text\" name=\"apellido\" \/><\/span>\n\t\t\t<\/p>\n\t\t<\/div>\n\t<\/div>\n\t<div class=\"form-row\">\n\t\t<div class=\"column-half\">\n\t\t\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"correo\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-email wpcf7-validates-as-required wpcf7-text wpcf7-validates-as-email\" aria-required=\"true\" aria-invalid=\"false\" placeholder=\"Correo corporativo *\" value=\"\" type=\"email\" name=\"correo\" \/><\/span>\n\t\t\t<\/p>\n\t\t<\/div>\n\t\t<div class=\"column-half\">\n\t\t\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"telf-contacto\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-tel wpcf7-validates-as-required wpcf7-text wpcf7-validates-as-tel\" aria-required=\"true\" aria-invalid=\"false\" placeholder=\"Tel\u00e9fono *\" value=\"\" type=\"tel\" name=\"telf-contacto\" \/><\/span>\n\t\t\t<\/p>\n\t\t<\/div>\n\t<\/div>\n\t<div class=\"form-row\">\n\t\t<div class=\"column-half\">\n\t\t\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"compania\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-text wpcf7-validates-as-required\" aria-required=\"true\" aria-invalid=\"false\" placeholder=\"Compa\u00f1ia *\" value=\"\" type=\"text\" name=\"compania\" \/><\/span>\n\t\t\t<\/p>\n\t\t<\/div>\n\t<\/div>\n\t<div class=\"form-row\">\n\t\t<div class=\"column-full\">\n\t\t\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"mensaje\"><textarea cols=\"40\" rows=\"10\" maxlength=\"2000\" class=\"wpcf7-form-control wpcf7-textarea wpcf7-validates-as-required\" aria-required=\"true\" aria-invalid=\"false\" placeholder=\"Mensaje *\" name=\"mensaje\"><\/textarea><\/span>\n\t\t\t<\/p>\n\t\t<\/div>\n\t<\/div>\n\t<div class=\"form-row\">\n\t\t<div class=\"column-full color-acceptance\">\n\t\t\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"politica\"><span class=\"wpcf7-form-control wpcf7-acceptance\"><span class=\"wpcf7-list-item\"><label><input type=\"checkbox\" name=\"politica\" value=\"1\" aria-invalid=\"false\" \/><span class=\"wpcf7-list-item-label\">He le\u00eddo y acepto la <a href=\"https:\/\/www.hiberus.com\/politica\" target=\"_blank\"><u>Pol\u00edtica de privacidad<\/u><\/a><\/span><\/label><\/span><\/span><\/span>\n\t\t\t<\/p>\n\t\t<\/div>\n\t<\/div>\n\t<div class=\"form-row\">\n\t\t<div class=\"column-full color-acceptance\">\n\t\t\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"marketing\"><span class=\"wpcf7-form-control wpcf7-acceptance optional\"><span class=\"wpcf7-list-item\"><label><input type=\"checkbox\" name=\"marketing\" value=\"1\" aria-invalid=\"false\" \/><span class=\"wpcf7-list-item-label\">Me gustar\u00eda recibir comunicaciones de marketing de Hiberus y sobre sus productos, servicios y eventos.<\/span><\/label><\/span><\/span><\/span>\n\t\t\t<\/p>\n\t\t<\/div>\n\t<\/div>\n\t<div class=\"form-row\">\n\t\t<div class=\"column-half\">\n\t\t\t<p><input class=\"wpcf7-form-control wpcf7-submit has-spinner\" type=\"submit\" value=\"Contacta con nosotros\" \/>\n\t\t\t<\/p>\n\t\t<\/div>\n\t<\/div>\n\t<div class=\"form-row\">\n\t\t<div id=\"campos_ocultos\" class=\"hidden\">\n\t\t\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"oculto_analitica_new1\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-text\" id=\"oculto_analitica_new1\" aria-invalid=\"false\" value=\"\" type=\"text\" name=\"oculto_analitica_new1\" \/><\/span><br \/>\n<span class=\"wpcf7-form-control-wrap\" data-name=\"oculto_analitica_new2\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-text\" id=\"oculto_analitica_new2\" aria-invalid=\"false\" value=\"\" type=\"text\" name=\"oculto_analitica_new2\" \/><\/span><br \/>\n<span class=\"wpcf7-form-control-wrap\" data-name=\"oculto_analitica_new3\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-text\" id=\"oculto_analitica_new3\" aria-invalid=\"false\" value=\"\" type=\"text\" name=\"oculto_analitica_new3\" \/><\/span><br \/>\n<span class=\"wpcf7-form-control-wrap\" data-name=\"oculto_analitica_new4\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-text\" id=\"oculto_analitica_new4\" aria-invalid=\"false\" value=\"\" type=\"text\" name=\"oculto_analitica_new4\" \/><\/span><br \/>\n<span class=\"wpcf7-form-control-wrap\" data-name=\"oculto_analitica_new_p\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-text\" id=\"oculto_analitica_new_p\" aria-invalid=\"false\" value=\"\" type=\"text\" name=\"oculto_analitica_new_p\" \/><\/span>\n\t\t\t<\/p>\n\t\t<\/div>\n\t<\/div>\n<\/div>\n\n<!--end responsive-form--><div class=\"wpcf7-response-output\" aria-hidden=\"true\"><\/div>\n<\/form>\n<\/div>\n                    <\/div>\n                <\/div>\n            <\/div>\n        <\/div>\n        \n","protected":false},"excerpt":{"rendered":"<p>El reconocimiento de duplicados consiste en la identificaci\u00f3n de registros referentes a una misma entidad sin la ayuda de identificadores un\u00edvocos. Este&#8230;<\/p>\n","protected":false},"author":176,"featured_media":19261,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_ayudawp_aiss_exclude":false,"footnotes":""},"categories":[7],"tags":[17,29],"class_list":{"0":"post-19241","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-next-tech","8":"tag-big-data","9":"tag-data-analytics"},"acf":[],"_links":{"self":[{"href":"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-json\/wp\/v2\/posts\/19241","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-json\/wp\/v2\/users\/176"}],"replies":[{"embeddable":true,"href":"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-json\/wp\/v2\/comments?post=19241"}],"version-history":[{"count":8,"href":"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-json\/wp\/v2\/posts\/19241\/revisions"}],"predecessor-version":[{"id":39136,"href":"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-json\/wp\/v2\/posts\/19241\/revisions\/39136"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-json\/wp\/v2\/media\/19261"}],"wp:attachment":[{"href":"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-json\/wp\/v2\/media?parent=19241"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-json\/wp\/v2\/categories?post=19241"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.hiberus.com\/crecemos-contigo\/wp-json\/wp\/v2\/tags?post=19241"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}