Da dieser Text auch Prinzipielles zu der möglichen Technik von Bildervergleichen enthält, hier ein Auszug aus der Hilfe von AntiWin:
Um wirklich nach identischen oder ähnlichen Dateien zu suchen, ist der Inhaltsvergleich die bevorzugte Methode. Allerdings dauert der Inhaltsvergleich wesentlich länger als der Namensvergleich. Wenn man davon ausgeht, dass gleiche Dateien auch sehr ähnliche Dateinamen haben, kann man beide Vergleichsmethoden kombinieren - dies wirkt sich positiv auf die Suchgeschwindigkeit aus!
Wenn Sie den Byte-für-Byte-Vergleich mit 100% Übereinstimmung ausführen, können Sie absolut sicher sein, dass Anti-Twin nur vollkommen identische Dateien in der Ergebnisliste zeigt (Hinweis für Techniker: Anti-Twin verlässt sich nicht nur auf Prüfsummen/Hash-Werte).
Ähnliche Datei-Inhalte (binär)
Wenn Anti-Twin nicht nur Vollduplikate, sondern auch sich ähnelnde Dateien finden soll, kann die gewünschte Mindest-Übereinstimmung von standardmäßig 100% auf bis zu 60% herabgesetzt werden. Diese Funktion ist speziell dafür gedacht, nahezu gleiche Dateien zu finden, bei denen vielleicht nur eine Kleinigkeit geändert wurde.
Die Ähnlichkeitssuche wird von Anti-Twin angewendet, sobald man einen Wert unter 100% eingibt. Die Suche mit dem Ähnlichkeitsvergleich dauert sehr viel länger als die 100%-Vollduplikat-Suche!
Leider ist der Ähnlichkeitssuche beim Byte-für-Byte-Vergleich nur bei einigen wenigen Dateitypen sinnvoll. Eine Ähnlichkeit kann nämlich nur bei unkomprimierten und unverschlüsselten Dateien festgestellt werden. Warnung (speziell zum Ähnlichkeitsvergleich) Bitte prüfen Sie ähnliche Dateien vor dem Löschen noch sorgfältiger, als Sie es ohnehin schon tun sollten. Denn nach der Ähnlichkeitssuche werden Dateien aufgelistet, die nicht vollständig identisch sind, also keine echten Duplikate/Kopien sind.
Bildvergleich nach Pixeln
Aktivieren Sie die Option „Bilder vergleichen“, um nach ähnlichen Fotos zu suchen. Anti-Twin öffnet/dekomprimiert dann jedes Bild und vergleicht die enthaltenen Pixel (Bildpunkte) aller Bilder miteinander.
Dahingegen werden beim herkömmlichen Byte-für-Byte-Vergleich die Dateien nicht wie Bilder, sondern völlig ohne Interpretation als nichtssagende binäre Folge von Bytes angesehen. Dann ist es Anti-Twin nicht möglich ein Foto als ähnlich zu erkennen, wenn es z.B. in zwei Dateien mit unterschiedlicher Kompressionsrate (Bildqualität) oder in unterschiedlichen Dateiformaten (JPG, GIF, BMP, TIFF etc.) gespeichert ist. Aber mit dem Pixelvergleich funktioniert das!
Systemvoraussetzung: Damit Anti-Twin Bilder aus verschiedenen Grafikformaten lesen kann, wird Microsofts Funktionsbibliothek GDI+ benötigt, die standardmäßig ab Windows XP enthalten ist. Für ältere Windows-Versionen läßt sich GDI+ nachträglich installieren.
Vergleichstechnik: Es war technisch nötig den Bildervergleich in Anti-Twin so zu programmieren, dass nur eine unscharfe Ähnlichkeit erkannt wird. Denn durch verschiedene Bildformate und Kompressionen unterscheiden sich die Pixel immer etwas, selbst wenn dies eigentlich gar nicht gewollt ist (z.B. durch Farbreduktion oder Kompressionsartefakte). Anti-Twin ist beim Pixelvergleich deshalb extra ungenau und sogar farbenblind. Zudem ignoriert Anti-Twin bei Grafikdateien die Größe - sowohl die Dateigröße als auch die Breite und Höhe in Pixeln. Daraus folgt leider eine gewisse Unzuverlässigkeit im Ergebnis.
Das Ergebnis ist aber letztlich ziemlich zutreffend.
Ich erinnere mich dunkel an irgendein Programm, das auf der Basis der Farbwerte eine Bildes Vergleiche anstellt, weiß aber nicht mehr genau, welches das war.