Home Produkte

cs_20100504_1971358383


LASSEN SIE UNS MACHEN!

digitazionServices beinhaltet das Projekt- und Prozessmanagement, um industrielle Digitalisierungen ökonomisch und quellenschonend durchzuführen. Multimillonenseiten Projekte stellen neben der technologischen auch eine logistische Herausforderung dar - gespickt mit unzähligen projektkritischen Hürden. digitizationServices bietet einen umfassenden Service nach Ihren Spezifikationen von der Auswahl der Quellen bis zum Zurücksortieren. In der Folge sehen Sie eine Aufzählung der wichtigsten Meilensteine und die zertifizierten Prozesse zur Umsetzung durch das Projektmanagement der CCS.

 

INHALtsauswahl

  • Beurteilung des Quellmaterials bezüglich der Digitalisierbarkeit
  • Evaluierung In-House oder Off-Shore Image Capture
  • Synchronisation Metadaten Bibliothek - Digitalisierungscenter
  • Verfolgung des Quellmaterials und des Konvertierungsprozesses (Item-Tracking)

ERFASSUNG

  • Bestimmung der Scanner ( z.B. ZEUTSCHEL, KIRTAS, Image Access, Hasselblad, Phase One, Qidenus, Treventus, I2S)
  • Anpassen der Scanner Technologie an die Projektanforderungen
  • Scan-Interface zur Datenübernahme aus diversen Quellen

Konvertierungsprozess

  • Bildverbesserung: Entzerrung, Säubern, Beschneiden, etc.
  • Layoutanalyse: ausführliches Inhaltsauszeichnungsregelwerk
  • Seitenfolge: Kontrolle auf Vollständigkeit und Paginierung
  • Texterkennung: 124 Sprachen mit optionaler OCR Korrektur bezgl. Überschriften, Titel, Kapitel, Textblöcke, etc.
  • Intelligente Strukturerkennung:  Zeitungen, Journale, Bücher und Magazine mit optionaler ISR Korrektur
  • Bibliothekskatalog: Integration bestehender Metadaten via z39.50, Datenbank oder CSV

Datenausgabe

  • Texttransskription bis zu 99,995% Genauigkeit
  • multiple Bild-Derivate (TIFF, JPEG2000, JPEG etc.)
  • Erzeugung von Metadaten nach Bibliotheksstandads (METS, ALTO, TEI, MPEG21, MODS etc.)
  • Ausgabederivate PDF, PDF/A, strukturiertes PDF mit Volltextebene, RTF, MS-Word, TXT
  • Urheberrechtsauszeichnung in den Metadaten

PROJEKTMANAGEMENT

  • Technologie und Servicemanagement ISO 9001 zertifiziert
  • Transportmanagement Quellmaterial
  • webbasiertes Tool zur Zusammenmarbeit (SharePoint)
  • transparente Produktion (browserbasiertes Item Tracking)
  • zertifizierter Datenschutz und Datenschutzerklärung
  • zertifiziertes Datensicherungs- und Wiederherstellungsregelwerk
 

nw_20100504_1614685608

NEWSWORKS - WELTWISSEN AUF EINEN CLICK

Der Zugang zu aktuellen Informationen stellt heutzutage keine Hürde mehr dar. Im Gegenteil: Print, Online, TV, Radio und vermehrt die Sozialen Netzwerke kreieren eine Fülle an Informationen, die einem den Kopf schwirren lassen. Um trotzdem einen präzisen Einblick in die Medienlandschaft zu bekommen - und Markt und Konkurrenz beobachten zu können - ist ein System nötig, das die relevanten Informationen einfach, individuell und schnell herausfiltert.

CCS hat mit newsWorks eine Technologie entwickelt, die zeitsparend und effizient tagesaktuelle Informationen zielgerichtet durchsucht, mit Metadaten ergänzt und die Ergebnisse dem Empfänger in einem wunschgemäßen Pressespiegel zur Verfügung stellt. Dabei werden die Suchergebnisse „ausgeschnitten“, die teils unterschiedlichen Formate vereinheitlicht, anschließend übersichtlich zusammengefasst und dann per Download, Email, Email-Push oder RSS-Dienst auf den Computer, das Smartphone oder das Tablet weitergeleitet. Für welche Version Sie sich auch entscheiden (der klassische Ausdruck ist natürlich ebenfalls eine Option), Sie bekommen alle für Sie relevanten Informationen auf einen Blick, bzw. Click - zu jeder Zeit und überall.

Auf Wunsch kann die gesamte Clipping-Arbeit von Medienbeobachtungsagenturen übernommen werden und Sie müssen dann lediglich die Ergebnisse in Ihren Pressespiegel zusammenfassen.

newsWorks ist zuverlässig, individuell anpassbar und wird Ihnen helfen Ihre Presse- und Öffentlichkeitsarbeit effizienter zu gestalten. Dadurch können Sie schnell reagieren sowie Ihre strategischen Entscheidungen noch zielgerichteter treffen.

FEATURES
licensing_20100504_1143854067
Lizenzabrechnung für
PMG und VG-Wort
dualscreen_20100504_1785321777
Unterstützung von 2 Bildschirmen
sort_20100504_1647422921
Sortierdialog Pressespiegel
doc_20100504_1524976388
Pressespiegel als MS Word
hl_pdf_20100504_1459236056
PDF mit hiddenlayer Text
mobile_20100504_1152168729
PDF für Smartphone und Tablet
highlighting_20100504_1476778111
Keyword Highlighting
mysql_20100504_2022093369
MySQL Datenbankformat
feed_20100504_2017154519
Feedübernahme
push_20100504_1967958247
Feedausgabe

Optional Features

scanner_20100504_1070189825
Broadsheet Speedscan
clip_20100504_1430514250
Doppelseiten Split
multipage_20100504_1537848439
Multipage PDF Import
cold_20100504_1802533112
Cold-Standby Ausfall Konzept
hot_20100504_1151813084
Hot-Standby Ausfall Konzept
 
 

dw_20100504_2062793657

Jahrelange Entwicklungsarbeit hat mit docWorks eine Technologie entstehen lassen, die Dokumente im übertragenen Sinne sieht, erkennt, liest, versteht und die Konvertierungsqualität im gesamten Prozess überwacht. Wir möchten Ihnen hiermit einen etwas detailierteren Einblick in die Arbeitsschritte eines docWorks-Prozesses geben.

 

----------------

Das Scannen der Dokumente wird von speziellen Hochleistungsscannern durchgeführt, die vollautomatisch die einzelnen Seiten abfotografieren. Zur weiteren Verarbeitung müssen diese digitalen Kopien in das Programm docWorks „überführt“ werden. Dies passiert mit dem Modul scanClient, welches dafür sorgt, dass die Informationsübertragung reibungslos und ohne Informationsverlust stattfindet.

Im Anschluss erfolgt eine automatisierte digitale Bildbearbeitung, die - falls nötig und gewünscht - das Bild entzerrt und gerade rückt, Schmutz entfernt, Kontrast und Schärfe anpasst, Doppelseiten splittet und Farbkorrekturen durchführt.

In der folgenden Layout-Analyse identifiziert docWorks automatisch die gescannten Inhalte, d.h. es erkennt Überschriften, Untertitel, Fließtext, Tabellen und Illustrationen ebenso wie handschriftliche Bemerkungen, Fußnoten und Seitenzahlen.  

Die von der Layout-Analyse bestimmten Textabschnitte werden im nächsten Schritt mittels einer intelligenten Texterkennung in einzelne Wörter umgewandelt und automatisch gegen integrierte Wörterbücher der entsprechenden Sprachen geprüft.
docWorks erkennt eine große Bandbreite von aktuellen und historischen Schriften, selbst wenn diese gemsicht vorkommen sollten. 

Auf Basis der vorangegangen Prozesse kann docWorks nun die über alles stehende Struktur erfassen. Zum Beispiel identifiziert docWorks bei Büchern die einzelnen Kapitel, Vorspann und Nachspann - bei Zeitungen erkennt es, welcher Text zu welchem Foto und zu welcher Überschrift gehört und speichert diese dann als einzelnen Artikel. 
Die Text- und die Strukturerkennung sind die zentralen Bausteine von docWorks. Durch die Texterkennung wird es möglich ganze Bücher und Bibliotheken gleich in welcher Sprache gezielt nach einzelnen Begriffen zu durchsuchen.
Die Strukturerkennung wiederum gewährleistet, dass die Treffer nach Relevanz sortiert und übersichtlich dargestellt werden können. Denn nur wenn Suchbegriffe innerhalb des gleichen Artikels oder Beitrags gefunden werden, handelt es sich ja auch wirklich um einen relevanten Treffer. Ansonsten würde man sich durch unzählige Zeitungsseiten klicken müssen, in denen die Suchbegriffe zwar vorkommen, aber ohne dass sie zueinander in Verbindung stehen.
Die Strukturanalyse vereinfacht also maßgeblich die Suche. Da docWorks durch die Identifizierung einzelner Artikel diese auch (farblich) hervorheben oder freistellen kann, muss sich der Nutzer nicht erst auf der Buch- oder Zeitungsseite orientieren und kann dadurch schneller mit den Ergebnissen arbeiten.

Die Informationen zu Layout und Struktur des Dokumentes werden als zusätzliche Metadaten gespeichert. Die sogenannten ALTO-Dateien, die pro Seite abgespeichert werden, beinhalten Informationen zu Layout und Text. Zusätzlich gibt es für jede Publikation eine einzelne METS-Datei mit den Informationen zur Gesamtstruktur.
Eine digitale Publikation besteht also immer aus dem ursprünglichen Scan  (abgespeichert als Bilddatei, z.B. ein hochauflösendes Tiff für die Langzeitsicherung und ein kleineres Jpeg für die Web-Nutzung) und den relevanten Metadaten.
Die METS/ALTO-Dateien sind „offen“, d.h. sie können in jedes andere Format konvertiert werden und auch unabhängig von docWorks genutzt werden. Außerdem ist es durch den offenen Standard möglich, die Datenbanken verschiedener Bibliotheken, Sammlungen und Archive zu vernetzen und somit weltweit nutzbar zu machen.

Das fertige digitale „Produkt“ liegt am Ende der docWorks-Kette auf dem Datei-Server bereit und kann über die Suchmaske, z. B. Veridian, gefunden und eingesehen werden.
Um bestmögliche Ergebnisse zu gewährleisten, kann in einzelnen Abschnitten des Prozesses eine Prüfung der automatisch generierten Resultate stattfinden. Zur Qualitätssicherung stehen Werkzeuge zur Verfügung, die eine Überprüfung und die gegebenenfalls notwendige Korrektur jederzeit schnell und unkompliziert gewährleisten.



 

dwe_20100504_1855927917

FORTSCHRITTLICHE TECHNOLOGIE, EINFACHE ANWENDUNG
Es ist eine komplexe Angelegenheit ganze Archive von Büchern, Zeitungen, Magazinen und Dokumenten professionell in strukturierte und durchsuchbare Inhalte zu digitalisieren. Mehrere Schritte sind nötig: das Einlesen und Anpassen der gescannten Daten, die Layout- und Strukturanalyse der einzelnen Seiten und Publikationen, die Texterkennung und am Ende der Export in das richtige Format.
Bei so vielen unterschiedlichen Arbeitsschritten, für die oftmals mehrere Softwares notwendig sind, kann es an den Schnittstellen schnell zu Unregelmäßigkeiten kommen.

Um genau dies zu vermeiden, haben wir docWorks(e) entwickelt.
Wir dachten, der beste Weg, um Schnittstellen zu vermeiden, ist erst gar keine zu haben. docWorks(e) ist die erste Software, die den gesamten Konvertierungsprozess vom Importieren der Scandaten bis zum Daten-Export abdeckt - alles in einer Software und alles aus einer Hand. So müssen Sie sich nicht mit frustrierenden Softwareunverträglichkeiten aufhalten - es gibt einfach keine. docWorks(e) läuft so zuverlässig und ruhig, dass Sie vergessen werden welch Hochtechnologie unter der Oberfläche arbeitet. Kein Arbeitsschritt ist ausgegliedert, Sie haben alles unter Ihrer Kontrolle.
Und um die Arbeit mit docWorks(e) noch einfacher zu gestalten, haben wir einen speziellen Software-Assistenten entwickelt, der Sie bereits ab der Installtion durch alle Schritte begleitet.


ALLES IST IM FLUSS
Jahrelange Entwicklungsarbeit hat mit docWorks(e) eine Technologie entstehen lassen, die Dokumente im übertragenen Sinne sieht, erkennt, liest, versteht und die Konvertierungsqualität im gesamten Prozess überwacht.
Aktuellste Texterkennungsmöglichkeiten und die Layout- und Strukturanalyse sind die wesentlichen Komponenten für eine optimale digitale Bibliothek. Denn nur wenn Zeitungen und (wissenschaftliche) Publikationen in ihre unterschiedlichen Artikel und Beiträge geordnet werden, kann man wirklich relevante Suchergebnisse erzielen.
Darüber hinaus sind bei docWorks(e) die Metadaten „offen“, das bedeutet sie können jederzeit in andere Formate umgewandelt werden und somit auch unabhängig von docWorks(e) genutzt werden. Erst dadurch ist es möglich die Datenbanken verschiedener Bibliotheken, Sammlungen und Archive miteinander zu verbinden.


GROSSE VIELFALT
docWorks(e) unterstützt eine immense Bandbreite an Import- und Exportformaten.
Beim Import ist der scanClient Garant für eine schnelle und reibungslose Einpflege Ihrer gescannten Daten und beinhaltet sogar die Möglichkeiten bereits existierende Metadaten aus Ihrem Bibliothektskatalog mit einfließen zu lassen.
Bei den Ausgangsdaten werden alle Standard-Bibliotheksformate abgedeckt, inklusive der Ausgabe als ePub. So können Sie sicher sein, dass Ihre Nutzer alles finden und anschauen können, was sich in Ihrer Sammlung befindet.

Und falls Sie noch auf der Suche nach einem guten Präsentationssystem für Ihre digitale Bibliothek sind, können wir Ihnen unsere Nutzeroberfläche Veridian empfehlen. Diese wurde speziell für die besonderen Bedürfnisse von digitalen Sammlungen entwickelt und bietet Ihnen sogar die Möglichkeit Ihre Nutzer in die Weiterentwicklung Ihrer digitalen Sammlung mit einzubeziehen. Denn sollte ein Nutzer beim Stöbern über einen Fehler in der Texterkennung stolpern, so kann er diesen für Sie korrigieren (User Text Correction). Dadurch erhöht sich kontinuierlich die Qualität Ihrer digitalen Daten, fast wie von ganz alleine. Da Veridian auch PlugIns von Drittanbietern nutzt, die eine einfache Weiterverbreitung über Email oder soziale Netzwerke wie Facebook und Twitter erlauben, vergrößert sich die Gruppe Ihrer Nutzer/Helfer immer mehr, ohne dass Sie zusätzliche Kosten haben. 

Weiterlesen...
 

itr_20100531_1228893178

itemTracking  ist ein Browser-basiertes Nachverfolgungs- und Überwachungsmodul für alle sich im Digitalisierungsprozess befindlichen Dokumente.
(book tracking, newspaper tracking)

Basierend auf einer Barcode-Tracking-Nummer, ermöglicht itemTracking die Darstellung des physischen Verbleibs eines Dokumentes und den Konvertierungsstatus des zugehörigen Digitalisats. Der Zugriff kann von jedem mit dem Internet verbundenen PC erfolgen.

VERFÜGBARE OPTIONEN

  • Item-Vorbereitung und Zuordnung von bestehenden bibliographischen Metadaten
  • Versand-Tracking der Items und Vollständigkeits-Check bei Ankunft
  • Zwischen- und finale Sicherung
  • Scan-Prozess
  • Konvertierungsprozess
  • Export und digitale Lieferung inklusive Kundenabnahme


KOORDINIEREN, ÜBERWACHEN, REAGIEREN

itemTracking ermöglicht es Ihnen Massendigitalisierungsprojekte zu jeder Zeit, von jedem Ort aus zu managen, zu überwachen und zu analysieren. Es bietet die bestmögliche Transparenz für eine effiziente Projektumsetzung und effizientes Reporting und Krisenmanagement.

 

 

 

 

 



 

v_20100504_1048021803

 

Veridian macht es Ihnen einfach Ihre digitale Sammlung im Internet zu präsentieren. Und jetzt können Sie mit Veridian auch eine starke Nutzergemeinschaft um Ihre Sammlung aufbauen.

 

FORTSCHRITTLICHE TECHNOLOGIE, EINFACHE ANWENDUNG
Die Online-Präsentation von historischen Bibliotheken bietet einige Herausforderungen. Da ist zum Einen das große Datenaufkommen, welches verarbeitet werden muss, weiterhin die einheitliche Darstellung verschiedenster Formate, und eine Nutzeroberfläche, die verständlich und intuitiv nutzbar gestaltet sein sollte.

Um all diesen Anforderungen gerecht werden zu können, wurde Veridian entwickelt. Veridian nutzt modernste Technologien, um den Inhalt Ihrer Sammlung schnell und zuverlässig Forschern und Nutzern auf der ganzen Welt zur Verfügung zu stellen. Und das beste dabei: es ist unglaublich einfach zu installieren, auch für Nicht-Computerexperten. Gleichzeitig ist es so umfangreich konfigurierbar, dass Sie die Millionen Daten Ihrer Sammlung leicht und scheinbar mühelos organisieren können.
Veridian passt sich immer Ihren Anforderungen an und wächst auch mit seinen Aufgaben. So können Sie mit einer kleinen Sammlung anfangen und dann - wann immer nötig - mehr Datenvolumen aufstocken.
 
ALLES FÜR JEDEN
Sie wollen Zeitungen, Bücher, Magazine, Karten, Bilder oder sogar Videos und Audiodaten präsentieren? Kein Problem, Veridian kann jede Art von Inhalt verarbeiten und darstellen, so haben Sie alles in einer einheitlichen Sammlung. Darüber hinaus kann Veridian auch mit bestehender Bibliotheksinfrastruktur wie Ihrem Archiv-Management oder bereits verwendeter Such-Software verbunden werden, um ein reibungsloses und einfaches Zusammenspiel mit Ihrem Bibliothekssystem zu schaffen.

Und im Gegensatz zu vielen anderen Software-Anwendungen, gibt Veridian saubere und standardkonforme HTML aus. Dadurch wird sichergestellt, dass alle Online-Besucher Ihre Sammlung nutzen können, unabhängig davon welchen Internetbrowser, welches Betriebssystem oder welche Gerätart sie jeweils verwenden. Die Einhaltung von Standards und offenen Technologien bedeutet auch, dass Ihre Sammlung von jedem Tablet und Smartphone zugänglich ist. Für eine optimale Nutzerinteraktivität setzt Veridian Javascript ein.

Egal welche Daten Sie präsentieren möchten und egal wer diese Daten einsehen möchte - Veridian bringt sie beide zusammen.

VIELE HÄNDE BEDEUTEN WENIGER ARBEIT
Crowdsourcing ist der Oberbegriff, wenn viele Einzelne einen kleinen Beitrag zu einem größeren Ganzen leisten. Dieses Prinzip wird schon in vielfältiger Weise genutzt: zum Beispiel helfen uns die Meinungen und Empfehlungen vieler anderer bei unseren Kaufentscheidungen auf Amazon oder Ebay. Oder wir profitieren bei Wikipedia von Millionen anderen Menschen, die ihr Spezialwissen an diesem zentralen virtuellen Ort zusammentragen.

Mit Veridian können Sie nun auch Ihre Nutzer in die Weiterentwicklung Ihrer digitalen Sammlung mit einbeziehen. Sollte ein Nutzer beim Stöbern über einen Fehler in der Texterkennung stolpern, so kann er diesen für Sie korrigieren. Dadurch erhöht sich kontinuierlich die Qualität der digitalen Daten, fast von ganz alleine, mit der Hilfe von ganz Vielen. Und da Veridian auch PlugIns von Drittanbietern nutzt, die eine einfache Weiterverbreitung über Email oder Soziale Netzwerke wie Facebook und Twitter erlauben, vergrößert sich die Gruppe Ihrer Nutzer/Helfer immer weiter. Die Nationalbibliothek von Australien korrigiert auf diese Art und Weise bereits jetzt 1,5 bis 2 Millionen Textzeilen pro Monat!

REFERENZEN
Wir glauben, dass die Qualität unserer Produkte am besten für sich selber spricht. Deshalb laden wir Sie herzlich ein Veridian in praktischer Anwendung zu erfahren. Schauen Sie sich einfach kurz die Websites unserer Kunden wie der Nationalbibliothek von Neuseeland, den Universitäten von Kalifornien in Riverside und San Fracisco, der Princeton Universität oder des Königliche Tropeninstituts in Amsterdam an. Alle freuen sich auf Ihren Online-Besuch!

 

TECHNISCHE DATEN

Unterstützte Objektformate
- Dokumente (PDF, DOC, XLS, PPT, TXT, RTF)
- Bilder (JPEG, GIF, PNG, TIFF, BMP, JPEG2000)
- Videos (MOV, MPEG, AVI, WMV)
- Audiodateien (MP3, WAV, AIFF)

Unterstützte Metadatenformate
- METS/ALTO (nativ)
- Dublin core
- MARC
- TEI
- HTML

METS/ALTO Unterstützung
- Native METS/ALTO Einbindung und Management
- Seiten-, Kapitel- oder Artikelbasierte Ausgabe
- Clipping einzelner Beiträgen
- Darstellung von mehrseitigen Artikeln

Programmiersprachen
- JAVA
- PERL
- Javascript/jQuery
- AJAX

Standardzugriff auf Drittsysteme
- OAI-PMH
- z39.50
- WebDAV


Nutzerfreundlichkeit
- Thumbnail Vorschau
- Textpassagen Vorschau für Suchergebnisse
- User Text Correction
- Markieren von Suchbegriffen
- Ansicht OCR-Ausgabe
- Verlinkung zu sozialen Netzwerken
- PDF Download
- Mehrseiten-Ansicht
- Vollbild-Ansicht
- Kompatibel mit mobilen Endgeräten

Zugang zur Sammlung
- Feldspezifische Suche
- Boolesche Suche
- Unscharfe Suche (abhängig von Art der Sammlung)
- Eingrenzende Suchfilter

Software Plattformen
- LINUX
- UNIX
- Windows
- MacOS
- SOLARIS

Unterstützte Sprachen
- Englisch
- Deutsch
- Spanisch
Die Sprachauswahl kann jederzeit angepasst werden




 

vx_logo

e-docVALIDATOR ist die Technologie zur Visualisierung, Analyse und Validierung von bibliotheks-relevanten digitalen Datenformaten.

Benefits

  • No longer incomplete, corrupt or invalid documents
  • Detailed reports and statistics on data and quality
  • Independent from any other system
  • Ensure you deliver just perfect material / ensure you receive perfect material (useful for service providers as well as for service requesters)
  • Visual inspection and random QA
  • Configurable validation procedures
  • Support many formats like METS, ALTO, TIFF, JP2, PDF, XML,


 

 

mw_20100504_1026905303

Echtzeit Multikanal Audio und Video Recorder mit Speech2Text Technologie

Die konventionelle Pressebeobachtung im Bereich Radio und TV ist eine ressourcenintensive und zeitraubende Aufgabe. Die digitale Lösung mediaWORKS bietet die Möglichkeit 12 Video- und Audiokanäle gleichzeitig 7 Tage die Woche 24 Stunden am Tag zu beobachten, ohne danach über 300 Video- und Audiobänder sichten, katalogisieren und lagern zu müssen. Audio-, Video-, und Datenspuren werden mit synchronisiertem Timecode „IN BULK“ aufgezeichnet. Der Operator kann im Live-Betrieb Marker setzen, an denen die Weiterverarbeitung on demand erfolgt.

Weiterlesen...
 


 © 2010 • CCS Content Conversion Specialists GmbH • Weidestrasse 134 • 22083 Hamburg • T +49 40 227 130 0 • F +49 40 227 130 11 • info@content-conversion.com
Impressum      Haftungsausschluss     Datenschutzrichtlinie      Kontakt