gitignore

2022-10-18 18:48:24 +02:00
parent 1c580dad9c
commit 5a72e1843d
41 changed files with 110 additions and 106 deletions
--- a/.gitignore
+++ b/.gitignore
@@ -0,0 +1 @@
 *.mp3
--- a/Failure/Alone
+++ b/Failure/Alone
--- a/Wizards/Demons
+++ b/Wizards/Demons
--- a/dsbm/Fornicatus/Children
+++ b/dsbm/Fornicatus/Children
--- a/Begonia.mp3
+++ b/Begonia.mp3
--- a/Pain/Introduksjon
+++ b/Pain/Introduksjon
--- a/Pain/Lidende.mp3
+++ b/Pain/Lidende.mp3
--- a/Pain/Welcome
+++ b/Pain/Welcome
--- a/Cold/Alone
+++ b/Cold/Alone
--- a/Happiness.mp3
+++ b/Happiness.mp3
--- a/Failure/Dying
+++ b/Failure/Dying
--- a/Life/Defeated
+++ b/Life/Defeated
--- a/Life/Emotionally
+++ b/Life/Emotionally
--- a/Days/Defeated
+++ b/Days/Defeated
--- a/Days/Defeated
+++ b/Days/Defeated
--- a/Days/Defeated
+++ b/Days/Defeated
--- a/Negativity/En
+++ b/Negativity/En
--- a/Negativity/Jeg
+++ b/Negativity/Jeg
--- a/Negativity/Nedslåttheten.mp3
+++ b/Negativity/Nedslåttheten.mp3
--- a/Negativity/Tiggeren
+++ b/Negativity/Tiggeren
--- a/Days/Happiness
+++ b/Days/Happiness
--- a/Here.../Sovnlose
+++ b/Here.../Sovnlose
--- a/Days/Happiness
+++ b/Days/Happiness
--- a/Memories/Drowning
+++ b/Memories/Drowning
--- a/Memories/Neglect....mp3
+++ b/Memories/Neglect....mp3
--- a/Days/Melancholic
+++ b/Days/Melancholic
--- a/Light/Suici.De.pression/...and
+++ b/Light/Suici.De.pression/...and
--- a/Light/Suici.De.pression/A
+++ b/Light/Suici.De.pression/A
--- a/Light/Suici.De.pression/I
+++ b/Light/Suici.De.pression/I
--- a/Light/Suici.De.pression/In
+++ b/Light/Suici.De.pression/In
--- a/Light/Suici.De.pression/Suici.De.pression
+++ b/Light/Suici.De.pression/Suici.De.pression
--- a/src/pycache/download.cpython-310.pyc
+++ b/src/pycache/download.cpython-310.pyc
--- a/src/pycache/download_links.cpython-310.pyc
+++ b/src/pycache/download_links.cpython-310.pyc
--- a/src/pycache/metadata.cpython-310.pyc
+++ b/src/pycache/metadata.cpython-310.pyc
--- a/src/pycache/url_to_path.cpython-310.pyc
+++ b/src/pycache/url_to_path.cpython-310.pyc
--- a/src/download.py
+++ b/src/download.py
@@ -1,9 +1,77 @@
 import requests
 import os.path
 import pandas as pd
 from mutagen.easyid3 import EasyID3
 import json
 import logging
 """
 https://en.wikipedia.org/wiki/ID3
 https://mutagen.readthedocs.io/en/latest/user/id3.html
 >>> from mutagen.easyid3 import EasyID3
 >>> print(EasyID3.valid_keys.keys())
 dict_keys(
    [
        'album',
        'bpm',
        'compilation',
        'composer',
        'copyright',
        'encodedby',
        'lyricist',
        'length',
        'media',
        'mood',
        'grouping',
        'title',
        'version',
        'artist',
        'albumartist',
        'conductor',
        'arranger',
        'discnumber',
        'organization',
        'tracknumber',
        'author',
        'albumartistsort',
        'albumsort',
        'composersort',
        'artistsort',
        'titlesort',
        'isrc',
        'discsubtitle',
        'language',
        'genre',
        'date',
        'originaldate',
        'performer:*',
        'musicbrainz_trackid',
        'website',
        'replaygain_*_gain',
        'replaygain_*_peak',
        'musicbrainz_artistid',
        'musicbrainz_albumid',
        'musicbrainz_albumartistid',
        'musicbrainz_trmid',
        'musicip_puid',
        'musicip_fingerprint',
        'musicbrainz_albumstatus',
        'musicbrainz_albumtype',
        'releasecountry',
        'musicbrainz_discid',
        'asin',
        'performer',
        'barcode',
        'catalognumber',
        'musicbrainz_releasetrackid',
        'musicbrainz_releasegroupid',
        'musicbrainz_workid',
        'acoustid_fingerprint',
        'acoustid_id'
        ])
 """
 class Download:
    def __init__(self, session: requests.Session = requests.Session(), file: str = ".cache3.csv", temp: str = "temp"):
@@ -18,14 +86,17 @@ class Download:
        self.dataframe = pd.read_csv(os.path.join(self.temp, self.file), index_col=0)
        for idx, row in self.dataframe.iterrows():
            row['artist'] = json.loads(row['artist'].replace("'", '"'))
            self.download(row['path'], row['file'], row['url'])
            self.write_metadata(row, row['file'])
    def download(self, path, file, url):
        if os.path.exists(file):
            logging.info(f"'{file}' does already exist, thus not downloading.")
            return
        os.makedirs(path, exist_ok=True)
-        logging.info(f"downloading: {url}")
+        logging.info(f"downloading: '{url}'")
        r = self.session.get(url)
        if r.status_code != 200:
            if r.status_code == 404:
@@ -36,99 +107,22 @@ class Download:
            mp3_file.write(r.content)
        logging.info("finished")
    def write_metadata(self, row, file):
        audiofile = EasyID3(file)
-"""
+        audiofile["artist"] = row['artist']
-class Track:
+        audiofile["albumartist"] = row['album_artist']
-    def __init__(self, url: str, release: Release, track_name: str, track_artists: list = None,
+        audiofile["date"] = str(row['year'])
-                 session: requests.Session = requests.Session()):
+        audiofile["genre"] = row['genre']
-        self.session = session
+        audiofile["title"] = row['title']
-        self.url = url
+        audiofile["album"] = row['album']
-
+        audiofile["tracknumber"] = str(row['track'])
        parsed_url = urllib.parse.urlparse(url)
        path = os.path.normpath(parsed_url.path)
        split_path = path.split(os.sep)
        url_type = split_path[1]
        if url_type != "track":
            raise Exception(f'"{url}" is supposed to link a track.')
        name = split_path[2]
        name = name.split("-")
        self.id = name[-1]
        self.name = "-".join(name[:-1])
        self.track_artists = track_artists
        self.release = release
        self.pretty_track = track_name
        self.mp3_url = self.get_mp3_url()
    def __str__(self):
    def fetch(self):
        return
    def get_mp3_url(self):
        # https://musify.club/track/dl/17254894/ghost-bath-convince-me-to-bleed.mp3
        return f"https://musify.club/track/dl/{self.id}/{self.name}.mp3"
    def add_album_art(self, path):
        img = self.release.raw_artwork
        audio = EasyMP3(path, ID3=ID3)
        try:
            audio.add_tags()
        except _util.error:
            pass
        audio.tags.add(
            APIC(
                encoding=3,  # UTF-8
                mime='image/png',
                type=3,  # 3 is for album art
                desc='Cover',
                data=img.read()  # Reads and adds album art
            )
        )
        audio.save()
    def download(self):
        download_path = os.path.join(self.release.path, self.name + ".mp3")
        # download only when the file doesn't exist yet
        if not os.path.exists(download_path):
            logging.info(f"downloading: {self.mp3_url}")
            r = requests.get(self.mp3_url, proxies=proxy)
            if r.status_code != 200:
                if r.status_code == 404:
                    logging.warning(f"{self.mp3_url} was not found")
                    return -1
                raise ConnectionError(f"\"{self.mp3_url}\" returned {r.status_code}: {r.text}")
            with open(download_path, "wb") as mp3_file:
                mp3_file.write(r.content)
            logging.info("finished")
        audiofile = EasyID3(download_path)
        if self.track_artists is not None:
            audiofile["artist"] = self.track_artists
        else:
            audiofile["artist"] = self.release.pretty_release
        audiofile["albumartist"] = self.release.artist.pretty_name
        audiofile["date"] = self.release.year
        if self.release.genre is not None:
            audiofile["genre"] = self.release.genre
        audiofile["title"] = self.pretty_track
        audiofile["album"] = self.release.pretty_release
        audiofile.save()
        # self.add_album_art(download_path)
 """
 if __name__ == "__main__":
    logging.basicConfig(level=logging.DEBUG)
    proxies = {
        'http': 'socks5h://127.0.0.1:9150',
        'https': 'socks5h://127.0.0.1:9150'
--- a/src/main.py
+++ b/src/main.py
@@ -1,11 +1,14 @@
 import metadata
 import download_links
 import url_to_path
 import download
 import logging
 import requests
 TEMP = "temp"
 STEP_ONE_CACHE = ".cache1.csv"
 STEP_TWO_CACHE = ".cache2.csv"
 STEP_THREE_CACHE = ".cache3.csv"
 logging.basicConfig(level=logging.INFO)
@@ -34,16 +37,25 @@ def search_for_metadata(query: str):
 def cli():
    session = requests.Session()
    session.proxies = {
        'http': 'socks5h://127.0.0.1:9150',
        'https': 'socks5h://127.0.0.1:9150'
    }
    search = search_for_metadata(query=input("initial query: "))
    logging.info("Starting Downloading of metadata")
    search.download(file=STEP_ONE_CACHE)
    logging.info("Fetching Download Links")
-    download_links.Download(file=STEP_TWO_CACHE, metadata_csv=STEP_ONE_CACHE, temp=TEMP)
+    download_links.Download(file=STEP_TWO_CACHE, metadata_csv=STEP_ONE_CACHE, temp=TEMP, session=session)
    logging.info("creating Paths")
    url_to_path.UrlPath("dsbm")
    logging.info("starting to download the mp3's")
    download.Download(session=session, file=STEP_THREE_CACHE, temp=TEMP)
 if __name__ == "__main__":
    cli()
--- a/src/metadata.py
+++ b/src/metadata.py
@@ -1,4 +1,5 @@
 import os.path
 from select import select
 import musicbrainzngs
 import pandas as pd
@@ -82,17 +83,8 @@ class Search:
    def download_track(self, mb_id, is_various_artist: bool = None, track: int = None, total_tracks: int = None):
        """
-        Title
+        album
-        Artist
+        bpm
        Album:
        Album artist
        Composer
        Genre
        Track number <> of <>
        Disc number <> of <>
        Year
        BPM
        Comment
        Album Art
        """
@@ -100,7 +92,8 @@ class Search:
        aliases, tags, user-tags, ratings, user-ratings, area-rels, artist-rels, label-rels, place-rels, event-rels, 
        recording-rels, release-rels, release-group-rels, series-rels, url-rels, work-rels, instrument-rels """
-        result = musicbrainzngs.get_recording_by_id(mb_id, includes=["artists", "releases"])
+        result = musicbrainzngs.get_recording_by_id(mb_id, includes=["artists", "releases", "recording-rels"])
        print(result)
        recording_data = result['recording']
        release_data = recording_data['release-list'][0]
@@ -109,7 +102,7 @@ class Search:
        artist_ids = [artist_['artist']['id'] for artist_ in recording_data['artist-credit']]
        def get_additional_release_info(mb_id_):
-            r = musicbrainzngs.get_release_by_id(mb_id_, includes=["artists", "recordings"])
+            r = musicbrainzngs.get_release_by_id(mb_id_, includes=["artists", "recordings", "recording-rels"])
            is_various_artist_ = len(r['release']['artist-credit']) > 1
            tracklist = r['release']['medium-list'][0]['track-list']
            track_count_ = len(tracklist)
@@ -322,10 +315,10 @@ def interactive_demo():
 if __name__ == "__main__":
-    interactive_demo()
+    # interactive_demo()
    # automated_demo()
-    # search = Search(query="psychonaut 4")
+    search = Search(query="psychonaut 4")
    # search.download_release("27f00fb8-983c-4d5c-950f-51418aac55dc")
    # for track_ in search.download_artist("c0c720b5-012f-4204-a472-981403f37b12"):
    #     print(track_)
-    # search.download_track("83a30323-aee1-401a-b767-b3c1bdd026c0")
+    search.download_track("83a30323-aee1-401a-b767-b3c1bdd026c0")
--- a/temp/.cache1.csv
+++ b/temp/.cache1.csv
@@ -0,0 +1,2 @@
 ,id,title,artist,album_artist,album,year,track,total_tracks
 0,39e9dee2-6b09-4aa5-bb5b-d04fa43578db,Black Smoke Curling From the Lips of War,['Cradle of Filth'],Cradle of Filth,Existence Is Futile,2021,6,12
--- a/temp/.cache2.csv
+++ b/temp/.cache2.csv
@@ -0,0 +1 @@
 ""
--- a/temp/.cache3.csv
+++ b/temp/.cache3.csv
@@ -0,0 +1 @@
 ""
		`@@ -0,0 +1,2 @@`
							`,id,title,artist,album_artist,album,year,track,total_tracks`
							`0,39e9dee2-6b09-4aa5-bb5b-d04fa43578db,Black Smoke Curling From the Lips of War,['Cradle of Filth'],Cradle of Filth,Existence Is Futile,2021,6,12`