Leer UUID de XML en listado de archivos con Python
Hola bienvenidos a un nuevo post, esta semana quiero compartirles un ejemplo de un programa en Python 2.7 que me ayudo a poder leer el nodo UUID de mis recibos de nómina, se preguntaran para que, bueno ya esta próximo el mes de abril que es el mes de declaración anual para personas físicas en México y me gusta ir preparando mi información para cuando llega el momento, bueno entonces busque el listado de los UUID.
La lógica de mi programa es:
- Primero obtener la ruta de donde voy a buscar los archivos XML (mis recibos) en mi caso puse la ruta, pero también pueden utilizar el comando raw_input. En el programa la línea: path = 'c:\\Users\\Ana \\Documents\\2020\\declaracion\\XML_nominas\\'
- De esa carpeta solo buscar archivos con extensión XML
- Primero para recorrer el directorio con el os.walk que nos regresa 3 lista, primero el directorio, luego los subdirectorios, los archivos, esto en el programa es for r,d,files in os.walk(path):
- Después buscar solo los archivos con extensión o terminación .XML en el programa if file.endswith(".xml"):
- Después buscar en nodo tfd:TimbreFiscalDigital, para ello primero es necesario :
- hacer un parse a los datos del archivo : xmL = pulldom.parse(file)
- Luego buscar en los nodos del XML for event, element in xmL: if event == pulldom.START_ELEMENT and element.tagName == 'tfd:TimbreFiscalDigital' :
- Luego encontrar la característica UUID , almacenarla en una variable e imprimirla en el programa son las siguientes lineas UUID = element.getAttribute('UUID') print ("UUID",UUID)
- Utilice la librería os para leer mi path, para el caso de rutas en Windows deben colocar "//" doble diagonal entre cada directorio, si fuera Linux o Unix solo un "\"
- Para colocar comentarios en Python utilicen el caracter "#"
- Para imprimir la información, utilicen print
Para ello el programa es:
import os
from xml.dom import pulldom
path = 'c:\\Users\\Ana\\Documents\\2020\\declaracion\\XML_nominas\\'
#path = raw_input("Enter the path:")
files = []
for r,d,files in os.walk(path):
for file in files:
if file.endswith(".xml"):
print(file)
xmL = pulldom.parse(file)
for event, element in xmL:
if event == pulldom.START_ELEMENT and element.tagName == 'tfd:TimbreFiscalDigital' :
UUID = element.getAttribute('UUID')
print ("UUID",UUID)
Ejecución del programa
No es un software de contabilidad, pero es un ejemplo de como podemos utilizar Python para nuestra declaración anual.
Ustedes pueden ajustar el programa para que lea otros nodos y que les de más información si la necesitan. Espero les sea de utilidad y recuerden si son personas físicas y el año pasado tuvieron facturas por gastos médicos (psicólogo, nutriólogo, dentista,lentes), colegiaturas (hasta preparatoria) , transporte de sus hijos, gastos funerarios, donaciones, hipotecarios, que son los que recuerdo pueden presentar su declaración ante el SAT para más información, les comparto la liga del SAT
Espero este programa les sea de utilidad, compartan el post y nos sigan en el #programacionparatodos y en nuestra página de Facebook
Muy bueno, gracias
ResponderBorrarMe da gusto que te haya servido :)
ResponderBorrarexcelente me ayudo mucho gracias
ResponderBorrarMe da mucho gusto Jorge, gracias por dejar tus comentarios :)
BorrarEn python 3.9.7 en Linux yo tuve que agregar el path al archivo:
ResponderBorrarxmL = pulldom.parse(path+file)
Fuera de eso funciona bien, Gracias
Yo lo implemente para el nodo cfdi:Concepto para buscar campos del Diesel y filtrar con pandas
Atte: C.P. Andrés
Hola Andres que bueno que te encontraste como hacerlo funcionar en Linux y nos lo comparte,(CP es de contador público?
Borrar