logo
    Abstract:
    This article proposes that only by prioritizing the formulation of data rights protection and circulation rules that adapt to the development characteristics of the artificial intelligence industry, can the compliance costs of enterprises be reduced, and ultimately, high-quality datasets can be developed and utilized to promote innovation in the artificial intelligence industry and to form a new engine for social progress in the 21st century. The action research includes supporting the development of public clouds, orderly guiding departments, units, and individuals to purchase public cloud computing resources and services, and avoiding duplicate construction of intelligent computing centers. The research project emphasizes the need to guide and support enterprises to increase cloud computing, computing power leasing, algorithm valuation, and arithmetic purchasing through social forces, reduce the cost pressure of user research and application development, deepen industrial integration, and expand application scenarios. This article proposes that data elements should not be limited to addition empowerment, but should focus on multiplier mechanisms. Firstly, we need to accelerate the expansion of artificial intelligence big data open innovation platforms, while encouraging enterprises and research institutions to share high-quality corpus resources. We also need to support professional data annotation and cleaning preprocessing work, ultimately opening up a high-quality data source for building big models.
    This paper reveals ten big characteristics (10 Bigs) of big data and explores their non-linear interrelationships through presenting a unified framework of big data. The framework has three levels: fundamental level, technological level, and socio-economic level. The fundamental level has four big fundamental characteristics of big data. The technological level consists of three big technological characteristics of big data. The socioeconomic level has three big socioeconomic characteristics of big data. The paper looks at each level of the proposed framework from a service-oriented perspective. The proposed approach in this paper might facilitate the research and development of big data, big data analytics, business intelligence, and business analytics.
    Business Intelligence
    Big business
    Citations (58)
    Big Data consist of large scale data which is complicated and diverse, so that new and different types of integration of techniques and technologies are required to uncover various hidden values from such big datasets. Big Data surrounding is used to set up and examine the diverse sorts of information. Big Data be data that is so massive in volume, so various in range or moving with excessive speed is referred to as Big Data. Acquiring and analysing Big Data be a challenging job because it consists of large dispersed file systems which must be bendy, fault tolerant and scalable. Diverse technologies used by big data application toward hold the huge quantity of data are Hadoop, Map Reduce, and so on. In this paper, firstly the description of big dataset is provided. In next section the different technologies are described which are used for managing Big Data. After that, Big Data method application and in last section we discuss the relation of Big Data and IoT as well as IoT for Big Data analytics.
    Data set
    We are living in an age of big data and artificial intelligence (AI). The current questions are: what is the future of big data? What era do we live in? This paper addresses these questions by looking at meta as an operation and argues that we are living in the era of big intelligence through analyzing from meta (big data) to big intelligence. More specifically, this paper will analyze big data from an evolutionary perspective. The paper overviews data, information, knowledge, and intelligence (DIKI) and reveals their relationships. After analyzing meta as an operation, this paper explores Meta(DIKI) and its relationship. It reveals 5 bigs consisting of big data, big information, big knowledge, big intelligence and big analytics. Applying meta on 5 bigs, this paper infers that big data 4.0 = meta4 (big data) = big intelligence. This paper analyzes how intelligent big analytics support big intelligence. The proposed approach in this research might facilitate the research and development of big data, big data analytics, business intelligence, artificial intelligence, and data science.
    Business Intelligence
    Intelligence analysis
    Citations (2)
    Big data has had significant impacts on our lives, economies, academia and industries over the past decade. The current questions are: What is the future of big data? What era do we live in? This article addresses these questions by looking at meta as an operation and argues that we are living in the era of big intelligence through analyzing from meta (big data) to big intelligence. More specifically, this article will analyze big data from an evolutionary perspective. The article overviews data, information, knowledge, and intelligence (DIKI) and reveals their relationships. After analyzing meta as an operation, this article explores Meta (DIKE) and its relationship. It reveals 5 Bigs consisting of big data, big information, big knowledge, big intelligence and big analytics. Applying meta on 5 Bigs, this article infers that Big Data 4.0 = meta4 (big data) = big intelligence. This article analyzes how intelligent big analytics support big intelligence. The proposed approach in this research might facilitate the research and development of big data, big data analytics, business intelligence, artificial intelligence, and data science.
    Business Intelligence
    Citations (3)
    This paper provides a service-oriented foundation for big data. The foundation has two parts. Part 1 reveals 10 big characteristics of big data. Part 2 presents a service-oriented framework for big data. The framework has fundamental, technological, and socio-economic levels. The fundamental level has four big fundamental characteristics of big data: big volume, big velocity, big variety, and big veracity. The technological level consists of three big technological characteristics of big data: Big intelligence, big analytics, big infrastructure. The socioeconomic level has three big socioeconomic characteristics of big data: big service, big value, and big market. The article looks at each level of the proposed framework from a service-oriented perspective. The multi-level framework will help organizations and researchers understand how the 10 big characteristics relate to big opportunities, big challenges, and big impacts arising from big data. The proposed approach in this paper might facilitate the research and development of big data, big data analytics, business intelligence, and business analytics.
    Business Intelligence
    Big business
    Citations (0)
    This paper provides a service-oriented foundation for big data. The foundation has two parts. Part 1 reveals 10 big characteristics of big data. Part 2 presents a service-oriented framework for big data. The framework has fundamental, technological, and socio-economic levels. The fundamental level has four big fundamental characteristics of big data: big volume, big velocity, big variety, and big veracity. The technological level consists of three big technological characteristics of big data: Big intelligence, big analytics, big infrastructure. The socioeconomic level has three big socioeconomic characteristics of big data: big service, big value, and big market. The article looks at each level of the proposed framework from a service-oriented perspective. The multi-level framework will help organizations and researchers understand how the 10 big characteristics relate to big opportunities, big challenges, and big impacts arising from big data. The proposed approach in this paper might facilitate the research and development of big data, big data analytics, business intelligence, and business analytics.
    Business Intelligence
    Big business
    Big Idea
    Οι ραγδαία αναπτυσσόμενες τεχνολογίες δημιουργούν ολοένα και μεγαλύτερες ανάγκες για την ανάλυση και την αξιοποίηση των υφιστάμενων δεδομένων. Πολλοί οργανισμοί βασίζουν την βιωσιμότητα τους στην ανάλυση των δεδομένων της αγοράς αλλά και των δεδομένων που παράγουν οι ίδιοι είτε μέσω της εξαγωγής χρήσιμων στατιστικών και δεικτών απόδοσης είτε αξιοποιώντας τα κατά τη διαδικασία λήψης αποφάσεων όπου μια από τις σημαντικότερες παραμέτρους στην ανάλυση τους είναι η παράμετρος του χρόνου. Για να μπορέσει να αποθηκευτεί και να αναλυθεί ο πολλές φορές τεράστιος όγκος δεδομένων δημιουργήθηκαν νέοι μέθοδοι διαχείρισης και ανάλυσης δεδομένων. Αυτό έγινε ιδιαίτερα αισθητό με την έλευση των Big Data. Οι τεχνολογίες που αναπτύχθηκαν έδωσαν την ευκαιρία της επέκτασης των μεθόδων που υπήρχαν για τα συμβατικά δεδομένα αλλά και την δημιουργία νέων μεθόδων, τεχνικών και συστημάτων ώστε να μπορούν να παρέχουν την ίδια ή ακόμα και καλύτερη ανάλυση. Καθώς όμως η τεχνολογία προχωράει με την έλευση του IOT ο όγκος των δεδομένων αλλά και οι ροές δεδομένων αυξάνονται ραγδαία. Οι ροές αυτές θα πρέπει να αποθηκευτούν να αναλυθούν και να συνδυαστούν με άλλα δεδομένα ώστε να εξαχθούν χρήσιμες πληροφορίες. Με την έλευση του ΜL/AI ολοένα και περισσότερα διαδικασίες μπορούν να αυτοματοποιηθούν παράγοντας αυτόματα καινούργια γνώση. Ένα από το κυριότερα προβλήματα που υπάρχουν όμως είναι η έλλειψη επισημασμένων δεδομένων. Ένα από τα πιο διαδεδομένα ερωτήματα που υπάρχουν για την εξαγωγή συμπερασμάτων από τα δεδομένα είναι τα ερωτήματα κορυφογραμμής. Τα ερωτήματα κορυφογραμμής ανήκουν στην κατηγορία των multi-objective optimization προβλημάτων και έχουν ως στόχο την ανάκτηση ενός συνόλου απαντήσεων που ικανοποιεί κάποια συνήθως αντικρουόμενα κριτήρια. Η χρήση τέτοιου τύπου ερωτημάτων είναι πάντα χρήσιμη καθώς έχει πολλά πεδία εφαρμογής και μπορεί να βοηθήσει ιδιαίτερα στην διαδικασία λήψης αποφάσεων όπου υπάρχουν πολλαπλά κριτήρια για την επίτευξή ενός στόχου και η βέλτιστη λύση μπορεί να μην είναι μοναδική. Μέχρι στιγμής η βιβλιογραφία στο συγκεκριμένο ερευνητικό πεδίο εμφανίζει ένα σημαντικό πλήθος εργασιών οι οποίες κατά κύριο λόγο ασχολούνται με συμβατικά δεδομένα και υπάρχει χώρος για έρευνα στο πεδίο των Big Data. Λαμβάνοντας υπόψη όλα τα παραπάνω η διατριβή αυτή έχει ως στόχο την πραγματοποίηση μιας εκτενούς ανασκόπησης στον χώρο των ερωτημάτων κορυφογραμμής, την ανίχνευση των προδιαγραφών και των αναγκών σε δεδομένα ενός πληροφοριακού συστήματος για θαλάσσιο περιβάλλον, την ανάλυση της παραμέτρου του χρόνου στα ερωτήματα κορυφογραμμής, την ανάπτυξη ερωτημάτων κορυφογραμμής σε δενδρικές δομές ειδικά σχεδιασμένες για Big Data και την δημιουργία ενός ταξινομητή (classifier) για μεγάλα δεδομένα. Πιο αναλυτικά η πρώτη συνεισφορά είναι μια εκτενής ανασκόπηση του χώρου των ερωτημάτων κορυφογραμμής όπου θα παρουσιαστεί η οικογένεια των ερωτημάτων κορυφογραμμής με όλες τις παραλλαγές τους, την διαφοροποίηση ανάμεσα στις μεθόδους που βασίζονται η όχι σε ευρετήριο καθώς και τις εφαρμογές που έχουν τα ερωτήματα κορυφογραμμής για την επίλυση πληθώρας προβλημάτων. Μέσα από αυτή της ανασκόπηση παρουσιάζεται πως τα ερωτήματα κορυφογραμμής εξελίχθηκαν και ανοίγει ο δρόμος για την εύρεση τομέων οι οποίοι μπορούν να διερευνηθούν περαιτέρω. Στην δεύτερη συνεισφορά θα δούμε τις διάφορες πτυχές των δεδομένων στο πλαίσιο ενός θαλάσσιου πληροφοριακού συστήματος. Η ανάλυση που έγινε αφορούσε την ανασκόπηση του χώρου και των δεδομένων που χρειάζονται για την υλοποίηση ενός θαλάσσιου πληροφοριακού συστήματος καθώς και τους περιορισμούς που υπάρχουν στην επεξεργασία και την διακίνηση των δεδομένων αυτών. Μέσω της συγκεκριμένης έρευνας έγινε φανερή η έννοια των Big Data, ανιχνευθήκαν μεγάλα σύνολα δεδομένων τα οποία είναι διαθέσιμα για ανάλυση και είδαμε ότι η παράμετρος του χρόνου είναι πολύ σημαντική για την πραγματοποίηση αναλύσεων στα δεδομένα. Επίσης είδαμε του βασικότερους περιορισμούς στην διακίνηση και επεξεργασία των δεδομένων. Στην τρίτη συνεισφορά μελετάτε ο τρόπος με τον οποίο μπορεί να ενσωματωθεί η διάσταση του χρόνου στα ερωτήματα κορυφογραμμής. Η διάσταση του χρόνου είναι μια σημαντική παράμετρος στην ανάλυση των δεδομένων και στην πραγματοποίηση επερωτήσεων η οποία πολλές φορές δεν λαμβάνεται υπόψη. Με αυτήν της έρευνα θα δούμε ότι η παράμετρος του χρόνου μπορεί να επηρεάσει τα αποτελέσματα ενός ερωτήματος κορυφογραμμής κάτι που καταδεικνύει πως χρειάζεται να γίνει ιδιαίτερη ανάλυση ως προς την διάσταση του χρόνου και να παραμετροποιηθούν κατάλληλα το ερώτημα κορυφογραμμής ώστε να ενσωματωθεί η διάσταση του χρόνου σε αυτά. Η τέταρτη συνεισφορά εξετάζει την εφαρμογή των ερωτημάτων κορυφογραμμής στον χώρο των Big Data και συγκεκριμένα του SpatialHadoop. To SpatialHadoop είναι μια επέκταση του συμβατικού Hadoop το οποίο προσπαθεί να ενσωματώσει τις δενδρικές δομές που υπάρχουν για τα συμβατικά δεδομένα στο Hadoop. Μέσω αυτής της ανάλυσης μπορούμε να δούμε την συμπεριφορά των αλγορίθμων κορυφογραμμής που δεν χρησιμοποιούν κάποια ευρετηρίαση αλλά και αυτών που χρησιμοποιούν σε περιβάλλοντα Big Data και πως αποδίδουν οι υβριδικοί συνδυασμοί που χρησιμοποιούν αλγόριθμους επερωτήσεων κορυφογραμμής που δεν βασίζονται σε ευρετήρια στο ευρετηριασμένο σύνολο δεδομένων που δημιουργεί το SpatialHadoop. Τέλος ένα από τα μεγαλύτερα προβλήματα που υπάρχουν κατά την διάρκεια ανάπτυξης ενός μοντέλου μηχανικής μάθησης είναι η ελλείψει επισημασμένων δεδομένων. Η έλλειψη αυτή γίνεται ακόμα πιο αισθητή σε περιβάλλοντα Big Data καθώς εκεί λόγω όγκου είναι πιο δύσκολη η επισήμανση τους. Στην βιβλιογραφία υπάρχουν πολλοί μηχανισμοί επισήμανσης δεδομένων ανάλογα με την εφαρμογή τους αλλά δεν υπάρχουν όμως μηχανισμοί για την αποδοτική επισήμανση μεγάλου όγκου δεδομένων. Στην πέμπτη συνεισφορά δημιουργήθηκε ένας μηχανισμός επισήμανσης δεδομένων που βασίζεται στο ερωτήματα κορυφογραμμής. Η χρήση ερωτημάτων κορυφογραμμής επιτρέπει την δημιουργία των ορίων αποφάσεως αποτελούμενων από μικρό αριθμό σημείων.
    Citations (0)
    This chapter examines three organizations in depth, exploring how they have successfully deployed Big Data tools and seen amazing results. They are Quantcast: a small big data company, Explorys: the human case for big data, and NASA: how contests, gamification, and open innovation enable big data. It has dispelled the myth that only big organizations can use and benefit from Big Data. On the contrary, size doesn't matter. Progressive organizations of all sizes, types, and industries are reaping big rewards. They have realized that Big Data is just too big to ignore.
    Big business
    Citations (0)
    Big Data have increased immense interest in the past few years. Nowadays analyzing Big Data is very common constraint and such chuck really turns into a big challenge to analyze the mass amount of data to get impact and different patterns of information on aconvenient way.Processingthe big data information in a single machine or evento storethese Big Data has become another big challenge of the Big Data. The elucidation for the above constraints is to give out data over large clusters so that Big Data to be analyzed and for storinginformation should beovercome. The article will explore perceptions of Big Data Analysisusing emerging tools of Big Data such as ApacheHadoop and Spark and its performance
    SPARK (programming language)
    Education of cloud engineers will be crucial for the continued development of cloud technologies. We have developed an open-source software platform called edubase Cloud for education. The platform has multi-cloud architecture. In this paper, we discuss how edubase Cloud provides an alterable cloud platform and how effective it is for educating cloud engineers.