sample-configs/customocr/tika-config-rendered.xml

<?xml version="1.0" encoding="UTF-8" standalone="no"?>  <properties> <parsers>  <parser class="org.apache.tika.parser.ocr.TesseractOCRParser"/>  <parser class="org.apache.tika.parser.pdf.PDFParser"> <params>  <param name="ocrStrategy" type="string">ocr_only</param> <param name="ocrImageType" type="string">rgb</param> <param name="ocrDPI" type="int">100</param> </params> </parser> </parsers> </properties>

sample-configs/customocr/tika-config-rendered.xml (13 lines of code) (raw):