Downloadliste

Projektbeschreibung

DataCleaner is a data quality analysis tool that allows you to perform data profiling, validating, and minor ETL-like tasks. These activities help you administer and monitor your data quality in order to ensure that your data is useful and applicable to your business situation. It can be used for master data management (MDM) methodologies, data warehousing projects, statistical research, preparation for extract-transform-load activities, and more.

Systemanforderungen

Die Systemvoraussetzungen sind nicht definiert
Information regarding Project Releases and Project Resources. Note that the information here is a quote from Freecode.com page, and the downloads themselves may not be hosted on OSDN.

2013-01-22 21:29
3.1.2

Ein Webdienst wurde die Überwachungsanwendung für immer ein (Liste) metrische Werte hinzugefügt. Die Komponente 'Tabelle Lookup' wurde verbessert durch Verknüpfung Semantik als konfigurierbare Eigenschaft hinzufügen. Die EasyDQ Komponenten wurden aktualisiert, weitere Konfigurationsoptionen und ein reicher Deduplizierung Ergebnis Interface hinzugefügt. Performance-Verbesserungen wurden speziell für diese Version. Verbesserungen wurden vorgenommen in der DataCleaner-Engine einen streaming Verarbeitung Ansatz in bestimmten Fällen Ecke weiter zu nutzen, die zuvor nicht behandelt wurde.
Tags: Minor feature enhancements, Minor bugfixes
A Web service was added to the monitoring application for getting a (list of) metric values. The 'Table lookup' component has been improved by adding join semantics as a configurable property. The EasyDQ components have been upgraded, adding further configuration options and a richer deduplication result interface. Performance improvements have been a specific focus of this release. Improvements have been made in the engine of DataCleaner to further utilize a streaming processing approach in certain corner cases which was not covered previously.

2013-01-05 06:50
3.1.1

Datum und Uhrzeit bezogene hinzufügen Verteilung Analysatoren für Wochenzahlen, Monate und Jahre Analysemöglichkeiten erweitert worden. Eine optionale "Deskriptive Statistik" Option wurde hinzugefügt, um die Anzahl Analyzer und dem Datum/Uhrzeit-Analyzer die Linien in den Charts Timeline, der Webanwendung Überwachung jetzt kleine Punkte in ihnen haben. Zwei neue Transformatoren wurden zum Generieren von UUIDs und zum Generieren von Zeitstempel hinzugefügt. Jetzt ad-hoc-Abfragen DISTINCT-Klauseln enthalten können *-Platzhalter und Unterabfragen und fehlertolerante an Text-Fall Fragestellungen sind.
Tags: Minor feature enhancements
The date and time related analysis options have been expanded, adding distribution analyzers for week numbers, months, and years. An optional "descriptive statistics" option has been added to the Number analyzer and the Date/time analyzer The lines in the timeline charts of the monitoring Web application now have small dots in them. Two new transformers have been added for generating UUIDs and for generating timestamps. Now ad hoc queries can contain DISTINCT clauses, *-wildcards, and subqueries, and are fault-tolerant towards text-case issues.

2012-12-18 12:20
3.1

Daten-Qualität-KPIs können jetzt als Formeln (mathematische Ausdrücke), nicht nur rohe Metriken definiert werden.
Es ist jetzt möglich, Ad-hoc-SQL-Abfragen für alle Datastores (DB, CSV, Excel usw.) ausgelöst. Eine neue Analyseoption der Wert Matcher, wurde hinzugefügt. Mit dieser Analyse ist es einfach, unerwartete Werte in einem Feld zu identifizieren. Verwaltung der Aufträge, einschließlich Kopieren und Löschen von Arbeitsplätze, worden viel einfacher erzielt durch die Funktionalität direkt in der Benutzeroberfläche bereitstellen. Es hat historische Daten Qualitätsmetriken ändern, um die Ergebnisse in die Timeline neu positionieren möglich gemacht.
Data Quality KPIs can now be defined as formulas (mathematical expressions), not just raw metrics.
It is now possible to fire ad-hoc SQL queries towards all datastores (DB, CSV, Excel, and more). A new analysis option, the Value matcher, was added. With this analysis, it's easy to identify unexpected values in a field. Management of jobs, including copying and deleting jobs, has been made a lot easier by exposing the functionality directly in the UI. It has been made possible to change historic data quality metrics in order to reposition results into the timeline.

2012-01-03 11:15
2.4.1

Dieses Release bringt kleinere Bugfixes, Leistungsverbesserungen und einige neue Eigenschaften. Unter den wichtigsten sind erheblich verbessert Batch laden Leistung, einem bequemen "Daten schreiben" Menü im Hauptfenster, doppelklicken Sie auf Umbenennen Stelle Komponenten, Syntaxfärbung in Javascript Transformator und Filter und Fixes für einen potenziellen Deadlock beim Starten der Anwendung.
Tags: Minor feature enhancements, Minor bugfixes
This release adds minor bugfixes, performance improvements, and a few new features. Among the important ones are greatly-improved batch loading performance, a convenient "write data" menu in the main window, double-click renaming of job components, syntax coloring in the Javascript transformer and filter, and fixes for a potential deadlock when starting the application.

2011-12-15 07:54
2.4

Unterstützung für MongoDB Datenbanken, sowohl für Lese-als auch Schreibvorgänge. Integration mit EasyDQ.com, bietet Kunden DQ Funktionen in der Wolke. Doppelte Erkennung (aka. Datendeduplizierung / Fuzzy matching) Analysatoren. Eine "Tabelle Lookup" Komponente für Suchvorgänge von mehrere Werte aus einer Tabelle. Eine "Insert into Tabelle" Komponente für Einfügen von Datensätzen in jeder Art von Tabelle (z. B. Datenbanktabellen, CSV-Dateien, Excel-Tabellen oder MongoDB Sammlungen). Job-Ebene Variablen die parametrierbare Arbeitsplätze ermöglichen, die über die Befehlszeile instrumentiert werden kann.
Tags: Major feature enhancements, mongodb, ETL, xml. lookup, customer data
Support for MongoDB databases, both for read and write operations. Integration with EasyDQ.com, which provides Customer DQ functions in the cloud. Duplicate detection (aka. Deduplication / Fuzzy matching) analyzers. A "Table lookup" component for doing lookups of multiple values from a table. An "Insert into table" component for inserting records into any kind of table (e.g. database tables, CSV files, Excel sheets, or MongoDB collections). Job-level variables which allow for parameterizable jobs that can be instrumented from the command line.

Project Resources