Leer UUID de XML en listado de archivos con Python

Hola bienvenidos a un nuevo post, esta semana quiero compartirles un ejemplo de un programa en Python 2.7 que me ayudo a poder leer el nodo UUID de mis recibos de nómina, se preguntaran para que, bueno ya esta próximo el mes de abril que es el mes de declaración anual para personas físicas en México y me gusta ir preparando mi información para cuando llega el momento, bueno entonces busque el listado de los UUID.

Declaracion Anual SAT


La lógica de mi programa es:


  • Primero obtener la ruta de donde voy a buscar los archivos XML (mis recibos) en mi caso puse la ruta, pero también pueden utilizar el comando raw_input. En el programa la línea:       path = 'c:\\Users\\Ana   \\Documents\\2020\\declaracion\\XML_nominas\\' 
  • De esa carpeta solo buscar archivos con extensión XML
    1. Primero para recorrer el directorio con el os.walk que nos regresa 3 lista, primero el directorio, luego los subdirectorios, los archivos, esto en el programa es for r,d,files in os.walk(path):
    2. Después buscar solo los archivos con extensión o terminación .XML en el programa if file.endswith(".xml"):
  • Después buscar en nodo tfd:TimbreFiscalDigital, para ello primero es necesario :
    1. hacer un parse a los datos del archivo : xmL = pulldom.parse(file)
    2. Luego buscar en los nodos del XML  for event, element in xmL:                if event == pulldom.START_ELEMENT and element.tagName == 'tfd:TimbreFiscalDigital' :
  • Luego encontrar la característica UUID , almacenarla en una variable e imprimirla en el programa son las siguientes lineas  UUID = element.getAttribute('UUID')                   print ("UUID",UUID)
  • Utilice la librería os para leer mi path, para el caso de rutas en Windows deben colocar "//" doble diagonal entre cada directorio, si fuera Linux o Unix solo un "\" 
  • Para colocar comentarios en Python utilicen el caracter "#"
  • Para imprimir la información, utilicen print

Para ello el programa es:


import os
from xml.dom import pulldom

path = 'c:\\Users\\Ana\\Documents\\2020\\declaracion\\XML_nominas\\' 
#path = raw_input("Enter the path:")

files = []
for r,d,files in os.walk(path):
    for file in files:
        if file.endswith(".xml"):
            print(file) 
            xmL = pulldom.parse(file)
            for event, element in xmL:
                if event == pulldom.START_ELEMENT and element.tagName == 'tfd:TimbreFiscalDigital' :
                   UUID = element.getAttribute('UUID')
                   print ("UUID",UUID)


Ejecución del programa

Leer XML con Python


No es un software de contabilidad, pero es un ejemplo de como podemos utilizar Python para nuestra declaración anual. 

Ustedes pueden ajustar el programa para que lea otros nodos y que les de más información si la necesitan.  Espero les sea de utilidad y recuerden si son personas físicas y el año pasado tuvieron facturas por gastos médicos (psicólogo, nutriólogo, dentista,lentes), colegiaturas (hasta preparatoria) , transporte de sus hijos, gastos funerarios, donaciones, hipotecarios, que son los que recuerdo pueden presentar su declaración ante el SAT para más información, les comparto la liga del SAT


Espero este programa les sea de utilidad, compartan el post y nos sigan en el #programacionparatodos  y en nuestra página de Facebook

Comentarios

  1. En python 3.9.7 en Linux yo tuve que agregar el path al archivo:
    xmL = pulldom.parse(path+file)

    Fuera de eso funciona bien, Gracias
    Yo lo implemente para el nodo cfdi:Concepto para buscar campos del Diesel y filtrar con pandas
    Atte: C.P. Andrés

    ResponderBorrar
    Respuestas
    1. Hola Andres que bueno que te encontraste como hacerlo funcionar en Linux y nos lo comparte,(CP es de contador público?

      Borrar

Publicar un comentario

Entradas más populares de este blog

Ejemplo Macro en Word

Macro de Excel para abrir archivo csv

API de banxico para obtener tipo de cambio utilizando Javascript