music-kraken-core/src/download_links.py

import os.path

import pandas as pd
import requests


# https://musify.club/search/suggestions?term=happy days

class Download:
    def __init__(self, metadata_csv: str = ".cache1.csv", session: requests.Session = requests.Session(),
                 file: str = ".cache2.csv", temp: str = "temp") -> None:
        self.temp = temp

        self.session = session
        self.session.headers = {
            "Connection": "keep-alive",
            "Referer": "https://musify.club/"
        }

        self.metadata = pd.read_csv(os.path.join(self.temp, metadata_csv), index_col=0)

        self.urls = []
        missing_urls, self.urls = self.check_musify()

        self.dump_urls(file)

    def check_musify_track(self, row):
        artist = row['artist']
        track = row['title']

        url = f"https://musify.club/search/suggestions?term={track}"

        r = self.session.get(url=url)
        if r.status_code == 200:
            autocomplete = r.json()
            for row in autocomplete:
                if any(a in row['label'] for a in artist):
                    return row

        return None

    def check_musify(self, urls: list = []):
        missing_urls = []

        def get_download_link(default_url):
            # https://musify.club/track/dl/18567672/rauw-alejandro-te-felicito-feat-shakira.mp3
            # /track/sundenklang-wenn-mein-herz-schreit-3883217'

            file_ = default_url.split("/")[-1]
            musify_id = file_.split("-")[-1]
            musify_name = "-".join(file_.split("-")[:-1])

            return f"https://musify.club/track/dl/{musify_id}/{musify_name}.mp3"

        for idx, row in self.metadata.iterrows():
            url = self.check_musify_track(row)
            if url is None:
                missing_urls.append(row['id'])
                continue
            data = dict(row)
            data['url'] = get_download_link(url['url'])
            urls.append(data)

        return missing_urls, urls

    def dump_urls(self, file: str = ".cache2.csv"):
        df = pd.DataFrame(self.urls)
        df.to_csv(os.path.join(self.temp, file))


if __name__ == "__main__":
    download = Download()
finished the urs and paths. Now just need to download stuff 2022-10-17 17:28:33 +00:00			`import os.path`

started link getter 2022-10-17 12:56:32 +00:00			`import pandas as pd`
			`import requests`

finished the urs and paths. Now just need to download stuff 2022-10-17 17:28:33 +00:00
started link getter 2022-10-17 12:56:32 +00:00			`# https://musify.club/search/suggestions?term=happy days`

			`class Download:`
finished the urs and paths. Now just need to download stuff 2022-10-17 17:28:33 +00:00			`def __init__(self, metadata_csv: str = ".cache1.csv", session: requests.Session = requests.Session(),`
			`file: str = ".cache2.csv", temp: str = "temp") -> None:`
			`self.temp = temp`

started link getter 2022-10-17 12:56:32 +00:00			`self.session = session`
			`self.session.headers = {`
			`"Connection": "keep-alive",`
			`"Referer": "https://musify.club/"`
			`}`

finished the urs and paths. Now just need to download stuff 2022-10-17 17:28:33 +00:00			`self.metadata = pd.read_csv(os.path.join(self.temp, metadata_csv), index_col=0)`

semi finished the fetching of download links from musify 2022-10-17 13:49:20 +00:00			`self.urls = []`
			`missing_urls, self.urls = self.check_musify()`
started link getter 2022-10-17 12:56:32 +00:00
finished the urs and paths. Now just need to download stuff 2022-10-17 17:28:33 +00:00			`self.dump_urls(file)`
started link getter 2022-10-17 12:56:32 +00:00
			`def check_musify_track(self, row):`
			`artist = row['artist']`
			`track = row['title']`

			`url = f"https://musify.club/search/suggestions?term={track}"`

			`r = self.session.get(url=url)`
			`if r.status_code == 200:`
			`autocomplete = r.json()`
			`for row in autocomplete:`
semi finished the fetching of download links from musify 2022-10-17 13:49:20 +00:00			`if any(a in row['label'] for a in artist):`
			`return row`

			`return None`

			`def check_musify(self, urls: list = []):`
			`missing_urls = []`

			`def get_download_link(default_url):`
			`# https://musify.club/track/dl/18567672/rauw-alejandro-te-felicito-feat-shakira.mp3`
			`# /track/sundenklang-wenn-mein-herz-schreit-3883217'`

			`file_ = default_url.split("/")[-1]`
			`musify_id = file_.split("-")[-1]`
			`musify_name = "-".join(file_.split("-")[:-1])`

			`return f"https://musify.club/track/dl/{musify_id}/{musify_name}.mp3"`

started link getter 2022-10-17 12:56:32 +00:00			`for idx, row in self.metadata.iterrows():`
			`url = self.check_musify_track(row)`
semi finished the fetching of download links from musify 2022-10-17 13:49:20 +00:00			`if url is None:`
			`missing_urls.append(row['id'])`
			`continue`
finished the urs and paths. Now just need to download stuff 2022-10-17 17:28:33 +00:00			`data = dict(row)`
			`data['url'] = get_download_link(url['url'])`
			`urls.append(data)`

semi finished the fetching of download links from musify 2022-10-17 13:49:20 +00:00			`return missing_urls, urls`

finished the urs and paths. Now just need to download stuff 2022-10-17 17:28:33 +00:00			`def dump_urls(self, file: str = ".cache2.csv"):`
semi finished the fetching of download links from musify 2022-10-17 13:49:20 +00:00			`df = pd.DataFrame(self.urls)`
finished the urs and paths. Now just need to download stuff 2022-10-17 17:28:33 +00:00			`df.to_csv(os.path.join(self.temp, file))`

started link getter 2022-10-17 12:56:32 +00:00
			`if __name__ == "__main__":`
			`download = Download()`