Skip to content

A web scraper and PDF generating script for the virtual library of the UniTO university.

License

Notifications You must be signed in to change notification settings

ornato-t/UniTO-book-scrape

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

29 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

UniTO book scrape

English version below.

UniTO-book-scrape è un'applicazione pensata per semplificare l'uso della biblioteca virtuale dell'Università di Torino (UniTO). 📚

L'applicazione è in grado di scaricare un libro, salvandolo in un comodo documento PDF. 📄

Vantaggi

  • Seleziona e cerca nel testo 🔎
  • Effettua il login una volta sola 🔓
  • Portabilità 🛩

A differenza della biblioteca virtuale, i PDF generati da quest'app dispongono di testo selezionabile!

Una volta effettuato il login e generato un PDF non sarà più necessario connettersi alla rete o inserire credenziali!

Esecuzione

Accedere all'ultima versione dell'app utilizzando la barra sulla destra (Releases). Da lì sarà possibile scaricare un archivio compresso contenente un eseguibile (.exe).

In alternativa, è possibile utilizzare NodeJS per eseguire gli script localmente.

npm i 

per installare le dipendenze

npm start

per compilare index.ts ed eseguire il risultante file index.js.

È possibile compilare tale script in un file binario tramite

npm run build

Errori frequenti

Un errore durante l'esecuzione non è una tragedia! Ecco una lista degli errori più frequenti

Durante il download

Error 404 while downloading 1.svg
Questo è un errore molto comune. Indica che non è stato trovato (404) un file di testo (.svg) per la pagina 1. Naturalmente il numero può essere differente, a seconda della pagina.
Alcune pagine non dispongono di testo, per cui alcune sporadiche istanze di questo errore sono del tutto normali e non indicano un fallimento critico.

Prima del download

Error, inputs can't be empty
Indica che almeno uno dei campi (username, password, link) non sono stati compilati. Ripetere l'esecuzione, avendo cura di riempirli tutti.

Error, invalid book URL
Indica che il link fornito non è valido. Ripetere l'esecuzione, avendo cura di copiare completamente il link. A titolo informativo, ecco un esempio dell'aspetto che dovrebbe avere il link:

http://unito.studenti33.it/secure/docs/00000000000000/HTML/0000/index.html

Disclaimer

Lo sviluppatore non ha modo di controllare l'uso che viene fatto dei PDF generati; pertanto ogni responsabilità è a carico degli utenti.

L'uso dell'app e dei PDF generati DEVE essere limitato a studenti regolarmente immatricolati presso UniTO e con diritto di accedere alla biblioteca virtuale.

Ogni eventuale violazione di copyright è a carico degli utenti.

UniTO book scrape (English)

UniTO-book-scrape is an application meant to simplify the use of the Università di Torino (UniTO) virtual library. 📚

The application is able to download a book, saving it in a convenient PDF document. 📄

Advantages

  • Select and search through text 🔎
  • Log in only once 🔓
  • Documents are portable 🛩

Unlike the virtual library, PDFs generated by this app feature selectable and searchable text!

Once a PDF is generated, users won't have to connect to the Internet or log in to view it!

Execution

Access to the latest version of the app by using the sidebar on the right (Releases). From there, download the zipped archive containing the executable file (.exe).

Alternatively, users may also run the scripts locally via NodeJS.

npm i 

to install all dependencies

npm start

to compile index.ts and run the resulting index.js file.

It is also possible to compile said file into a binary (.exe) via

npm run build

Troubleshooting, frequent errors

An error during the execution isn't necessarily a tragedy! Here is a list of the most frequent ones

During the download

Error 404 while downloading 1.svg
This is a very common error. It means that a text file (.svg) wasn't found (404). Naturally, the number preceding (.svg) may be different, depending on the page number.
Some pages don't have any text in them, therefore this error is very common and doesn't imply a critical failure.

Before the download

Error, inputs can't be empty
This means that at least one of the input fields (username, password, link) hasn't been filled. Repeat the execution, making sure to fill every field.

Error, invalid book URL
This means that the provided link isn't valid. Repeat the execution, making sure to properly copy and paste the link. As an example, here's how the link is supposed to look like:

http://unito.studenti33.it/secure/docs/00000000000000/HTML/0000/index.html

Disclaimer

The developer has no way of keeping track of how the generated PDF are used, therefore all responsibilities fall onto the users.

The usage of the app and the generated PDFs MUST be limited to regularly enrolled UniTO students, with right to access the virtual library.

Any and all copyright violations fall onto the user.