Coruña Corpus Tool (CCT)
Use this link to cite
http://hdl.handle.net/2183/21850
Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 4.0 Internacional
Collections
Metadata
Show full item recordTitle
Coruña Corpus Tool (CCT)Alternative Title(s)
CCTDate
2020Keywords
Corpus linguistics
Information retrieval
Information retrieval
Description
[Description] As it is being constantly updates, this is the 2020 version of this tool. The Coruña Corpus Tool (CCT) is an open-source development especially created by the IRLab in collaboration with MuStE to be used with the Coruña Corpus of English Scientific Writing (TEI-XML) as it offers representations of original spellings and is able to do searches discriminating variants. It offers intra-documental and collection basic search by single terms, concordance generation (KWIC), regular expressions search, with or without term-distance specification, as well as the possibility to select subsets of samples by using socio-external variables such as age or sex of the author, genre of the sample, etc.
This updated version of the CCT allows for the use of more than one subcorpus at the same time and is compatible with the previous CD-ROM versions of CETA and CEPhit, published by John Benjamins in 2012 and 2016, respectively. It is also compatible with the re-issues here, CHET and any other subcorpora by MuStE (https://ruc.udc.es/dspace/handle/2183/21846).
The object in this repository is a compressed file that contains a PDF Manual (for this version of the CCT) and also the client.jar file. In order to use the CCT, please download this compressed file to your computer, decompress and open the client.jar file. The Manual can be accessed at any time while running the CCT.
For optimal functioning, please make sure your Java is updated to the latest version.
For more information on this software, visit https://www.irlab.org/cct.html.
The use of this software is permitted, under the Apache 2.0 license terms, for exploiting the "Coruña Corpus". If you are not sure about its proper use, please contact us at irlab@udc.es. [Descrición] Esta ferramenta está sometida a revisión constante, e esta é a súa versión de 2020. Coruña Corpus Tool (CCT) é unha ferramenta de código aberto creada polo IRLab en colaboración con MuStE para o seu uso co Coruña Corpus of English Scientific Writing (TEI-XML). Permite representar as grafías orixinais e é capaz de facer procuras de acordo con diferentes variantes. Ofrece buscas de termos sinxelos tanto intradocumentais como na colección enteira, xeración de concordancias (KWIC), buscas con expresións regulares, buscas con ou sen especificacións de distancia entre termos, e a posibilidade de seleccionar conxuntos de mostras empregando variables externas sociais como a idade ou o sexo do autor, o xénero da mostra, etc.
Esta versión actualizada da CCT permite o uso de máis dun subcorpus ao tempo, e é compatible coas versións en CD-ROM de CETA e CEPhiT publicadas pola editorial John Benjamins en 2012 e 2016, respectivamente. É tamén compatible coas reedicións destes mesmos corpus, con CHET e con calquera outro subcorpus de MuStE (https://ruc.udc.es/dspace/handle/2183/21846).
O obxecto que se encontra neste repositorio é un arquivo comprimido que contén un Manual en PDF (desta versión da CCT) e o arquivo client.jar. Para usar a CCT, descargue o arquivo comprimido para o seu equipo, descomprímao e abra o arquivo client.jar. O Manual pode ser consultado en calquera momento durante o uso da CCT.
Para un funcionamento correcto, asegúrese de ter Java actualizado á última versión.
Para obter máis información sobre este software, visite https://www.irlab.org/cct.html.
O uso deste software está permitido, baixo os termos da licencia Apache 2.0, para a explotación do “Coruña Corpus”. Se non está seguro do seu uso correcto, por favor contacte connosco escribindo a irlab@udc.es. [Descripción] Esta herramienta está sometida a constante revisión, y esta es su versión de 2020. Coruña Corpus Tool (CCT) es una herramienta en código abierto creada por el IRLab en colaboración con MuStE para ser usada con el Coruña Corpus of English Scientific Writing (TEI-XML). La CCT ofrece representaciones de las grafías originales y permite hacer búsquedas con diferentes variables. Permite búsquedas de términos sencillos, tanto intradocumentales como en la colección entera, generar concordancias (KWIC), buscar expresiones regulares, buscar con o sin especificar la distancia entre términos y la posibilidad de seleccionar subconjuntos de muestras usando variables externas sociales, como la edad y el sexo del autor, el género de la muestra, etc.
Esta versión actualizada de la CCT permite el uso de más de un subcorpus al mismo tiempo, y es compatible con las versiones ya publicadas en CD-ROM de CETA y CEPhiT por la editorial John Benjamins en 2012 y 2016, respectivamente. Es también compatible con las reediciones de esos mismos corpus, con CHET y con cualquier otro subcorpus de MuStE (https://ruc.udc.es/dspace/handle/2183/21846).
El objeto que se encuentra alojado en este repositorio es un archivo comprimido que contiene un Manual en PDF de esta versión de la CCT y un archivo client.jar. Para usar la CCT, descargue el archivo comprimido a su equipo, descomprímalo, y abra el archivo client.jar. El Manual puede ser consultado en cualquier momento durante el uso de la CCT.
Para un funcionamiento correcto, asegúrese de tener Java actualizado a la última versión.
Para obtener más información sobre este software, visite https://www.irlab.org/cct.html.
El uso de este software está permitido, bajo los términos de la licencia Apache 2.0., para la explotación del “Coruña Corpus”. Si no está seguro de su uso correcto, por favor contacte con nosotros escribiendo a irlab@udc.es.
Rights
Atribución-NoComercial-SinDerivadas 4.0 Internacional