Skip to content

Microsoft Fabric - allt du behöver veta

I den ständigt föränderliga världen av datadrivet beslutsfattande växer Microsoft Fabric fram som en kraftfull bundsförvant för organisationer som söker en robust plattform för data engineering, analys och maskininlärning.
Dec 14, 2023 1:04:28 PM Tautvydas Raibikis, Data Engineer
En man står och tittar mot en stor mängd data.

 

Denna omfattande lösning integreras sömlöst i Microsoft-ekosystemet och erbjuder en enhetlig miljö där användare kan dra nytta av kraften hos data och molnens skalbarhet utan att behöva bekymra sig om den infrastruktur som behövs för att utföra stora datatillämpningar. Även om dess allmänna tillgänglighet nyligen tillkännagavs för bara några veckor sedan (15 november), har vi på twoday redan nyttjat denna lovande teknik hos några av våra kunder, även när den var i förhandsgranskning. 

I detta blogginlägg kommer vi att utforska de viktigaste funktionerna som gör Microsoft Fabric till en game-changer i världen av molnbaserad dataprocessering. 

En allt-i-ett AI-driven analysplattform   

I grunden fungerar Microsoft Fabric som en plattform för online-dataprocessering som är utformad för att hantera en rad olika datarelaterade uppgifter. Från data engineering till analys och maskininlärning ger den en enhetlig plats för dataexperter att arbeta effektivt och samarbeta. 

Business intelligence 

En av de mest framstående funktionerna i Microsoft Fabric är dess sömlösa integration med Power BI. Denna synergi säkerställer en smidig övergång från dataprocessering till visualisering och gör det möjligt för användare att hämta meningsfulla insikter från sina data. Plattformens förmåga att läsa direkt från Lakehouse Delta-tabeller eliminerar behovet av att integrera ditt dataplattformslager med affärsberedda data i Power BI, eftersom det är inneboende i Fabric. Denna integration strömlinjeformar rapporteringsprocessen och ger en sammanhängande helhetslösning. 

Lagring 

Microsoft Fabric levereras med en inbyggd datalake som kallas OneLake. Som namnet antyder är det en enda lagring inom din Fabric-miljö där du kan ladda upp dina data, bearbeta den och spara den i önskade format, till exempel som Delta-tabeller i ditt Lakehouse. OneLake är byggt ovanpå ADLS (Azure Data Lake Storage) Gen2. Tanken bakom det är att ha en kopia av data över hela din organisation för att undvika onödig duplicering och förflyttning. OneLake underlättar också snabb hämtning av data redo för rapportering till Power BI. Detta säkerställer att användare kan få tillgång till den information de behöver i realtid och underlättar snabba och informerade beslut. 

Data engineering 

När vi tittar på några av de andra funktionerna som Fabric erbjuder, drar den sig inte för att hantera stordataprocessering. Med integrationen av Apache Spark kan användare dra nytta av kraften hos distribuerad databehandling för att effektivt bearbeta stora mängder data. Med olika kapacitetsalternativ kan du välja den bästa databehandlingsinställningen för befintliga arbetsbelastningar och skala upp eller ner vid behov. Oavsett om det är i notebooks eller som en del av Spark-jobbdefinitioner ger plattformen flexibilitet för att hantera utmaningar med stora mängder data. 

Orkestrering 

När det gäller att orkestrera dina data engineering-arbetsbelastningar utmärker sig Microsoft Fabric genom att erbjuda en inbyggd Data Factory, vilket ger användare möjlighet att skapa datapipelines och flöden sömlöst. För alla som är bekanta med den ursprungliga versionen av Azure Data Factory bör övergången till att skapa och orkestrera pipeliner i Fabric vara enkel. 

Eftersom Microsoft strävar efter att ha en enhetlig plattform där olika dataperspektiv kan samarbeta, finns det olika "upplevelser" tillgängliga för olika dataspecialister. Låt oss titta på några av de upplevelser som finns tillgängliga i Fabric. 

Diagram over programvaren som en tjeneste foundation under de ulike opplevelsene av Fabric.

Figur 1: Den delade SaaS-grunden för Microsoft Fabric. 

Data Factory-upplevelse 

I Data Factory-upplevelsen kan vi skapa datapipelines på nästan identiskt sätt jämfört med Azure Data Factory. Vi har våra Lookup, CopyData, ForEach och andra aktiviteter som fungerar på samma sätt. Ett exempel på en pipeline som itererar genom vissa konfigurationsparametrar hämtade av en notebook (Figur 2, Figur 3): 

Microsoft Fabric bild

Figur 2: En pipeline som använder en notebooks-saktivitet för att returnera några parametrar för olika enheter och sedan iterera med varje uppsättning parametrar individuellt. 

Microsoft Fabric bild

Figur 3: Logik inne i ForEach-aktiviteten som kopierar data från källsystemet, landar det i landningszonen, bearbetar den landade filen och loggar enligt framgång/misslyckanden av olika stadier med hjälp av de passerade parametrarna. 

Data Engineering-upplevelse 

Som tidigare nämnts är notebooks utrustade med Apache Spark en av funktionerna som kommer med Microsoft Fabric. I det tidigare exemplet kan vi se hur de kan användas i våra datapipelines, och eftersom det är möjligt att skriva anpassad kod i dem med olika språk (Python, Scala, R, SQL) ger det utvecklarna stor flexibilitet att uppnå det önskade målet. 

Microsoft Fabric bild

Figur 4: Exempel på att köra PySpark-kod för att fråga en logg-tabell och få sammanfattade dagliga ingestionsstatistik. 

Data Warehouse-upplevelse 

Synapse Data Warehouse är ett 'traditionellt' datalager som stöder fullständiga transaktionella T-SQL-funktioner som ett företagsdatalager. Användarna av Fabrics lager har full kontroll över att skapa tabeller, ladda, omvandla och fråga data i datalagret med antingen Microsoft Fabric-portalen eller T-SQL-kommandon. Lagret har fullständigt transaktionellt DDL- och DML-stöd och skapas av en kund. 

Ett lager fylls av en av de stödda metoderna för dataingest som COPY INTO-kommandot, Pipelines, Dataflows, eller korsdatabas-ingesteringsalternativ som CREATE TABLE AS SELECT (CTAS), INSERT… SELECT eller SELECT INTO. Dess likhet med traditionella datalager gör det enkelt för dataspecialister att anpassa sin befintliga kunskap samtidigt som de drar nytta av de fördelar och skalbarhet som Fabric erbjuder. 

Microsoft Fabric bild

Figur 5: Sätt att skapa objekt i Fabrics Data Warehouse-upplevelse. 

Data Science-upplevelse 

Data Science-användare i Microsoft Fabric arbetar på samma plattform som affärsanvändare, analytiker och ingenjörer. Datadelning och samarbete blir smidigare över olika roller som ett resultat. Analytiker kan enkelt dela Power BI-rapporter och data, ingenjörer kan hjälpa till att undersöka problem som kan uppstå från källan, och allt detta är lättillgängligt för data science-användare. Enkelheten att samarbeta över roller i Microsoft Fabric gör kunskapsöverföring och felsökning mycket enklare för alla. 

Med verktyg som PySpark/Python, SparklyR/R kan notebooks hantera träning av maskininlärningsmodeller. ML-algoritmer och bibliotek kan hjälpa till att träna maskininlärningsmodeller. Bibliotekshanteringstjänster kan installera dessa bibliotek och algoritmer. Användare har därför möjlighet att dra nytta av ett stort antal populära maskininlärningsbibliotek för att slutföra sin ML-modellträning i Microsoft Fabric. 

Dessutom kan populära bibliotek som Scikit Learn också utveckla modeller. MLflow-experiment och körningar kan spåra träningen av ML-modellen. Microsoft Fabric erbjuder en inbyggd MLflow-upplevelse med vilken användare kan interagera för att logga experiment och modeller. 

Slutsats 

Microsoft Fabric framstår som en mångsidig och kraftfull lösning för organisationer som brottas med olika datarelaterade uppgifter. Från ostrukturerad till strukturerad data, från data engineering till analys och maskininlärning gör plattformens sömlösa integration med Power BI, inbyggda datalake, T-SQL-stöd för datalagerarbetsbelastningar, Data Factory och Apache Sparks funktioner, till ett omfattande verktyg för dataproffesionen . I takt med att företag fortsätter att navigera genom komplexiteterna i datalandskapet sticker Microsoft Fabric ut som en enhetlig plattform som låser upp hela potentialen av data för informerat och datadrivet beslutsfattande. 

 

Vill du veta mer om Microsoft Fabric? Kontakta oss så tar vi en pratstund!


Fyll i formuläret nedan så hittar vi en tid som passar dig.

 

 

Relaterade artiklar