LJSear.ch - un servicio para aquellos que necesitan los archivos "Live Journal"
Los Servicios Web / / December 24, 2019
¿Quieres encontrar en el registro de "aprender" un siglo de antigüedad, pero no puede, porque las opciones de búsqueda se limitan a un mes? Te liberarás de servicios LJSear.ch, Que contiene los archivos de la lengua rusa de LiveJournal para el período 2000-2015. Hablar de ello su creador romana Ivanov (kukutz).
Ivanov romana
Gerente de Producto en el "Yandex". Ha lanzado una búsqueda de blogs, búsqueda personalizada "Yandex", varias versiones de "Yandex. "servicios" Yandex electrónico. Lenta "" Ya.ru "" Yandex. Imágenes "y varios otros. Ahora se dedica a la "Yandex. Browser "y LJSear.ch.
¿Cuál es LJSear.ch?
"Learn" Esto es más de un terabyte de archivos. Indexados y disponibles para la búsqueda de 340 millones de mensajes y comentarios 1 mil millones entre 2000 y el otoño de 2015. Y todo esto con el familiar al blog herramientas de búsqueda: Límite por autor, por fecha, por la comunidad.
Las nuevas entradas no están indexados, ya que consideramos nuestro proyecto como un archivo, memorial.
El proyecto es totalmente sin fines de lucro, sin publicidad, y otras formas de ganar dinero no está destinado.
¿Por qué necesito el servicio?
En el otoño de 2015 la capacidad de búsqueda de blogs "Yandex" se limita a sólo el mes pasado. La explicación era sencilla: la gran mayoría de la gente está buscando informaciónAsociado con registros recientes, y la búsqueda profunda para ellos es redundante.
Es verdad. El mes pasado es suficiente para tareas como la supervisión periódica o una búsqueda tocador revisión de algunos acontecimientos recientes. Pero hay un problema y la investigación más profunda.
Creo que en el "aprender" que pasó, o al menos se refleja casi toda la cultura de habla rusa de cero años. El valor de este archivo no puede ser sobreestimada. Cuando el "Yandex" tiene búsqueda en el archivo cerrado, estoy muy decepcionado, ya convencido de que esta recopilación de información debe ser retenida para la humanidad. Bien y me preguntaron, archivos "Yandex", y de repente se acordaron y les dieron.
Archivo Blog bastante singular, ya que gran parte no puede ser descargado en el "aprender". Muchas revistas son retirados por sus autores, algunos roto y destruido por los piratas informáticos, en algunos casos, los registros no se eliminan, pero escondidos bajo llave.
Los últimos seis meses en que fue responsable de asegurar que los datos no se pierde. Llamé a la ayuda de amigos, y entre ellos estaban los que accedió a ayudar a entender si podemos hacer que la información disponible para la búsqueda. Hemos creado un servicio de LJSear.ch y al parecer lo llevó a su estado normal.
Los voluntarios eran muchos?
Fueron encontrados. Un reconocido experto en el campo de la UX Kohl Zayarny Se me ocurrió con el diseño. Sasha Belyanskiy Tomé el BEM-vorstku y de la aplicación acerca Node.js. Spaceinvaderz comprometido administración sistémica. programación backend en PHP que se inició sobre la base del prototipo en sí, lo que hizo que mi amigo Tobe.
El mayor problema era el hierro que va a pagar el hospedaje? Amigos seguridad de que puede obtener dinero para los sitios kraudfandingovyh, pero yo era escéptico. Y hay gente maravillosa llegaron a nosotros de Servers.ru y ofreció ayuda. Como resultado, tenemos un gran servidor dedicado con SSD para indexar y buscar backend además servidor de la nube virtual para el frontend.
Que puedan estar interesados en el proyecto?
A medida que nuevos registros no están indexados, el público, que tengo por cierto - son investigadores. Cómo literalmente investigadores capas culturales de cero años, y una corriente o ex consumidores de "Aprender", que quieren encontrar algo que estaba escrito en aquellos años. Y porque no limitan el tiempo máximo de ejecución Búsquedas: investigador puede esperar a consultas complejas y minutos, y dos. Por supuesto, consultas simples se ejecutan rápidamente, y si el servicio detecta que la consulta es ahora mucho, que incluye una degradación controlada, incluyendo los límites de tiempo de espera de petición.
LJSear.ch →