Поскольку машинное обучение Azure более зрело по сравнению с Synapse Data Science от Fabric, которое я недавно использовал, я хотел знать:
заранее спасибо
Чтобы получить доступ к данным OneLake из экземпляра Azure ML в рамках той же подписки, вы можете использовать Azure Data Lake Storage Gen2 (ADLS Gen2) в качестве промежуточного хранилища.
Вы можете использовать классы Datastore
и Dataset
в пакете SDK Azure ML для доступа к данным.
Надеюсь, это поможет :)
К вашему сведению: мне удалось сделать это таким образом, поскольку коннектор OneLake может с трудом точно соответствовать ожидаемым переменным API. В моей ситуации, чтобы получить таблицы в OneLake на Fabric:
datastore.yml
$schema: http://azureml/sdk-2-0/OneLakeDatastore.json
name: datastore_name
type: one_lake
description: Credential-less datastore pointing to a Microsoft Fabric
OneLake lakehouse
one_lake_workspace_name: "workspace_name"
endpoint: "onelake.dfs.fabric.microsoft.com"
artifact:
type: lake_house
name: "OnelakeName.Lakehouse/Tables"
В облачной оболочке после загрузки файла yml:
az ml datastore create --file datastore.yml --resource-group your_resource_group --workspace-name your_azureml_workspace
Внутри блокнота с помощью mltable:
!pip install mltable
from mltable import from_delta_lake
url = "abfss://path_of_the_resource_in_onelake/Tables/table"
df = from_delta_lake(url).to_pandas_dataframe()
Работает как шарм!